团队介绍:
我们是来自人称“上有天堂,下有苏杭”的美丽杭州的浙江大学数字媒体与设计实验室的dcd608。
在海量数据来临之时,我们深知云计算自然而然地登上并将在历史的舞台大放异彩。与此同时,致力机器学习与多媒体理解的我们这个团队希望让机器学习更加切实可行,从而方便我们的生活,智能我们的生活。
成员:高海东、卢鑫炎、谭谞
作品介绍:
题目:你不知道我知道
设计思想
1 分析问题信息,选择合理的评分方式,对待选问题进行筛选。
2 用户可能关心的是同一类问题。
3 用户可能对某一些关键词相关的问题感兴趣。
4 用户可能对某一些提问者的问题感兴趣。
5 用户可能对同一种导入方式的问题感兴趣。
设计特色
1 运用Map-Reduce中分布式缓存(DistributedCache)的思想将问题化繁为简。
2 对放数据还是参数入DistributedCache做了合理的选择,从而合理地利用Hadoop平台的资源。
题目:难舍难分
设计思想
1 我们采用了“多类逻辑斯蒂回归”(Multi-class Logistic Regression)的方法去求解,而不像很多算法是把多分类问题转换为二分类问题。
2 我们采用了梯度下降(Gradient Descent)的方法。
设计特色
1 运用Map-Reduce中分布式缓存(DistributedCache)的思想将问题化繁为简。
2 对放数据还是参数入DistributedCache做了合理的选择,从而合理地利用Hadoop平台的资源。
3 将数据分块处理,进一步降低了map和reduce之间的传输消耗,提高了时间。
4 使用二进制格式传输主要数据,很大程度上提高了效率。
难舍难分