计算机搜索引擎实验项目

方案特色

当今,大数据、云计算技术与平台快速发展,海量的信息和工具开始在云平台上得以部署,如何快速的检索用户关心的信息和工具,成为学术界研究的热点话题和产业界应用的急迫需求。


本项目授课和实验内容属于计算机科学与技术学科下信息检索的范畴,在学习过程中会渗透很多信息检索的历史、模型、思想、实现和应用,具体以构建更终的实验“一种新的海量流程模型高效检索方法的设计与实现”为目标,展开相关领域知识的讲解、讨论、设计及实现。

适合人群

对计算机感兴趣的高中

活动内容

Day 1

信息检索相关知识介绍、Petri网、Java编程基础

业务流程模型表示语言——Petri网及其建模、分析工具PIPE

Java编程语言、递归函数设计、UI设计及相关集成开发环境Intellij IDEA

·实验1:给定自然语言描述的业务流程,用PIPE工具进行Petri网建模并进行可达图分析


Day 2

企业业务流程展示、重要性介绍、应用场景阐述

信息检索模型介绍:布尔模型

基于BeehiveZ类库、jBPT类库的Petri网导入、遍历和输出

·实验2:基于BeehiveZ或jBPT编写程序,实现Project1中所建流程模型的循环结构查找及对每个节点按照深度进行编号的算法


Day 3

基于行为语义的流程模型相似性(Trace、CFS、TAR、BP、BP+)

基于BP+算法,介绍流程模型特征提取算法设计及其在BeehiveZ、jBPT工具中的实现

·实验3:基于BeehiveZ或jBPT编写程序,实现Project1中所建流程模型的TAR特征提取,并将对应特征输出到控制台


Day 4

信息检索机理介绍:倒排文档、查询与索引

流程模型的结构特征统计及流程模型索引设计的考虑

全文检索引擎工具包Lucene与BeehiveZ的集成

·实验4:基于jBPT编写程序,实现已有的BP+相似性算法的对应索引在BeehiveZ中的设计、实现与集成


Day 5

BeehiveZ中流程模型自动抓取程序、自动生成程序的实现机理

BeehiveZ中基于关键词、查询语言和样例的流程模型检索机制介绍

实习收尾总结及开放问题讨论

·实验5:基于jBPT编写程序,实现基于已有的BP+索引的基于样例的流程模型高效检索,并给出更终的测试模型库规模、测试环境及测试结果

申请策略

活动收获

实践内容丰富,掌握系统专业知识,熟悉核心计算机操作技能

获得实验报告与实习证明,表现优异的学生可获得官方推荐信

申请策略end 留学案例

常见问题

项目日期:2017年1月22日-26日(5天实地实习) 2月1日-15日(2周远程实习)

注:远程实习是指导师利用邮件、QQ等指导学生完成实验任务,每周导师与学生沟通1-2次

项目地点:北京

扫描下方二维码,关于该项目的任何问题都会逐一为你耐心解答! 一键掌握学科专项、海外体验、实习培训、公益慈善、综合思维和能力提升等众多精选高质量活动项目!

   青少年国际素质活动平台

版权声明:本文内容转载自网络,该文观点仅代表作者本人。登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。如发现本站有涉嫌抄袭侵权/违法违规的内容,请联系本站举报,一经查实,本站将立刻删除。