3675?1667865017

【周报】 张迅晖周报_2017-4-15 正常


张迅晖添加于 2017-04-15 10:03

1. 论文阅读

a) Summarizing software artifacts: a case study of bug reportsICSE 2010

b) Modelling the ‘Hurried’ Bug Report Reading Process to Summarize Bug ReportsESE 2015

两篇文章介绍了如何自动化抽取bug reportsummary,帮助更好理解bug report。主要思想是提取bug report描述和讨论中关键短语。根据人为定义的特征(包括评论时间,第x条评论,作者评论等)使用机器学习分类方法,提取关键短语进行整合。

借鉴之处:利用他们的方法得到代码文件summary

不同之处:已有的方法缺少对自然语言处理方法的使用,同时仅仅局限在bug report中,我们可以通过适当的改进让方法可以使用我们的summary提取。

c) ChangeScribe: A Tool for Automatically Generating Commit MessagesICSE 2015

这篇文章介绍了自动提取commit message的方法,即如何分析版本之间的代码变更,生成可理解的注释。

借鉴之处:我们的summary文本信息中包括代码级信息,因此可以借鉴这种方法,看直接通过代码信息能不能生成有用的文本描述。

d) Deep API LearningFSE 2016

这篇文章是曾雅蓉在师门报告会上介绍的文章

借鉴之处:里面介绍了根据注释信息提取summary的思路,虽然文中使用的方法比较简单,而且仅仅是针对java项目的,但是我们可以借鉴并应用到其他项目中,观察使用效果。

2. 研究点(生成开源代码文件summary

可以利用的文本信息包括:

a) issue/pr描述信息和评论信息(处理方法如1.a/1.b);

b) commit message信息(处理方法考虑同issuepr的处理方法);

c) 代码内部的注释信息(处理方法如1.d);

d) 代码(处理方法如1.c

3. 下一步工作

a) 帮助杨程师兄完成论文的扩展工作

b) 复现论文1.a/1.b中的方法,初步完成对issuepr文本信息的处理。

回复(1)
  • 3675?1667865017
    张迅晖 7年前

    跟踪缺陷 变更为 周报

    描述 已更新。 (查看差别)

0?1470885445
登录后可添加回复
  • 当前状态 新增
  • 选定优先级 正常
  • 指派给 --
  • 里程碑 --
  • 开始日期 2017-04-15
  • 结束日期
  • 预计工时(H) 0.00 小时
  • 完成度 0%
  • 关联Commit

© Copyright 2007~2021 国防科技大学Trustie团队 & IntelliDE 湘ICP备 17009477号

问题和建议
还能输入50个字符 提交

加入QQ群

关注微信APP


×