Skip to content

实时训练如何生成正负样本 #15

Open
@gzy0-0

Description

@gzy0-0

在曝光和点击进行interval join 时生成的数据是正样本,但是需要拿到曝光没有点击的数据。interval join 是否可以输出该数据,比如在数据淘汰的时候?
使用cogroup 的话,由于

public static long getWindowStartWithOffset(long timestamp, long offset, long windowSize) {
return timestamp - (timestamp - offset + windowSize) % windowSize;
}

曝光和点击可能位于不了一个window,这个情况怎么处理呢,非要借助外部存储进行记录吗

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions