Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

ml-1m数据集的validation data #6

Open
yaoodng7 opened this issue Nov 23, 2020 · 8 comments
Open

ml-1m数据集的validation data #6

yaoodng7 opened this issue Nov 23, 2020 · 8 comments

Comments

@yaoodng7
Copy link

您好,看完ENMF的论文后有两个疑问:
1.ml-1m的数据集的validation data是ml.train.txt中每个用户交互序列的最后一个吗
2.另外,我发现和官网的数据集有不一样,这个数据集是经过什么方法处理过的吗

@chenchongthu
Copy link
Owner

您好!感谢对我们工作感兴趣。
问题1:是的
问题2,我们没有对movielens-1m有过特殊处理,跟官网的movielens-1m有什么不一样的吗?

@yaoodng7
Copy link
Author

是这样,我用官网的数据集按照timestamp排序然后按相同方法取测试集发现和ml.test.txt不太一样,包括训练集的数据和ml.train.txt也不太相同

@chenchongthu
Copy link
Owner

哦哦,那可能数据分割之前shuffle过,这没什么影响的

@chenchongthu
Copy link
Owner

今天又看了一下,和官网不同是因为我们对用户和商品的ID做了一个映射,因为原始数据里用户ID并不是 0~用户数量。为了方便存储,我们先用字典对ID做了一个映射,虽然ID和原始数据不同,但是timestamp排序和连接关系还是一致的

@yaoodng7
Copy link
Author

yaoodng7 commented Dec 1, 2020

好的,谢谢您!!另外,方便提供一下ENMF论文中Ciao的数据集吗,论文中给的对应网站Not Found。非常感谢!!

@chenchongthu
Copy link
Owner

OK,请问邮箱是?

@yaoodng7
Copy link
Author

yaoodng7 commented Dec 1, 2020

[email protected], 如果可以epinions的也麻烦您发我一份,非常感谢!!!

@chenchongthu
Copy link
Owner

Ok,已经发送了,请查收~

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants