阅读方法:
- 首先,看摘要,了解这几篇论文解决了什么问题;
- 然后,看例子(examples),更加直观的理解所要解决的问题;
- 接着,看定义,理解问题的形式化(严谨)定义;
- 最后,试着理解算法,以及实验的大致内容
面临问题
发现图规则的两个挑战:
- 返回过多规则
- 无法很好地扩展到大规模图上
解决方法
采取了三种策略来解决问题:
- Application-driven rule discovery(应用驱动策略):通过机器学习模型,削减那些与用户兴趣无关的规则和数据。
- Sampling big graphs(采样大图):由于经应用驱动策略削减后的数据仍然可能很大,所以还需采样。需要考虑采样率,召回率和支持度。
- Parallel scalability(并行扩展):保证可以使用并行的方法,确保能够在大图上使用。