阅读方法:

  1. 首先,看摘要,了解这几篇论文解决了什么问题;
  2. 然后,看例子(examples),更加直观的理解所要解决的问题;
  3. 接着,看定义,理解问题的形式化(严谨)定义;
  4. 最后,试着理解算法,以及实验的大致内容

面临问题

发现图规则的两个挑战:

  1. 返回过多规则
  2. 无法很好地扩展到大规模图上

解决方法

采取了三种策略来解决问题:

  1. Application-driven rule discovery(应用驱动策略):通过机器学习模型,削减那些与用户兴趣无关的规则和数据。
  2. Sampling big graphs(采样大图):由于经应用驱动策略削减后的数据仍然可能很大,所以还需采样。需要考虑采样率,召回率和支持度。
  3. Parallel scalability(并行扩展):保证可以使用并行的方法,确保能够在大图上使用。