您好,欢迎来电子发烧友网! ,新用户?[免费注册]

您的位置:电子发烧友网 > 源码下载 > 数值算法/人工智能 >

基于多特征权重分配的源代码搜索优化

大小:0.95 MB 人气: 2018-04-17 需要积分:1

  在软件开发过程中,代码复用是提高软件开发效率的重要手段。目前,互联网中积累了大量的开源代码,如知名开源库GitHub、OSChina、CodePlex等。在编制程序时,程序员可以对这些开源代码进行复用,从而降低开发成本。代码搜索是对其复用的前提。如何从开源软件中准确地提取高质量的代码资源并复用到软件产品中,是提高软件开发效率需要解决的重要问题。

  针对代码搜索算法输入的不同形式,当前已经出现了基于关键字、接口、输入输出等形式的开源代码搜索引擎。不同于其他输入形式的搜索方法,由于方法签名是开发者通过一些能表达方法功能的词语根据驼峰命名法则命名的,所以基于关键字的搜索在匹配方法签名时往往更能体现方法功能的匹配;但针对面向对象语言开发的开源软件,当前基于关键字的搜索没有考虑其源代码具有多种代码特征,或者只考虑了用户查询语句与方法签名的单一匹配而忽视了源代码的其他重要特征如注释、类名等。比如源代码注释是对代码功能的描述,其中含有能体现方法功能的大量信息,这些信息对搜索特定功能的源代码是有帮助的。同理,类名中也含有少量体现代码功能的信息,而且源代码中各特征之间会有一定的联系。匹配时不能仅仅匹配单一方法名或者将多个代码特征转化成纯文本进行搜索而不考虑各代码特征的重要度,因此,将方法签名、源代码注释、方法体等代码特征结合起来应用于代码搜索中。
 

非常好我支持^.^

(0) 0%

不好我反对

(0) 0%

      发表评论

      用户评论
      评价:好评中评差评

      发表评论,获取积分! 请遵守相关规定!