Professor
Sign in to view more
Papers

Patents
Patentee: 北京拓尔思信息技术股份有限公司王洪俊,施水才
The embodiment of the invention provides a generation method of a question and answer knowledge base, a training method and equipment of a neural network. The generation method of the question and answer knowledge base comprises the steps of splitting document data and obtaining multiple knowledge fragments; conducting mapping on each knowledge fragment through the neural network, obtaining questions corresponding to each knowledge fragment, and thus generating and obtaining the question and answer knowledge base. Through the generation method of the question and answer knowledge base, the training method and equipment of the neural network, the difficulty of question and answer knowledge acquirement can be effectively reduced, and the manual workload is greatly reduced.
Publication Patent Date: 20170929Application Date: 20170428Publication Patent Number: CN107220296B
王庆红,韦嵘晖,李广凯,郑金,周育忠,张自锋,乔春庚,刘超,王洪俊,肖诗斌,施水才
本发明提供了一种利用计算机自动评价科技文献新颖性的方法,其包括如下步骤:A、基于文档内容排序的新颖性检测;B、基于文档语义比对的新颖性检测;C、基于关键术语的新颖性检测;D、基于数值指标的新颖性检测;E、基于步骤A-D分别得到各自的新颖性评分,运用回归模型计算出查新文档的新颖性总分。采用本发明的方法,可基于多维度新颖性检测的科技文献自动查新,提高科技查新的效率。
Publication Patent Date: 20160203Application Date: 20151021Publication Patent Number: CN105302793A
王庆红,韦嵘晖,李广凯,郑金,周育忠,张自锋,刘超,乔春庚,王洪俊,肖诗斌,施水才
本发明公开了一种自助式查新方法及系统,该方法包括:根据用户输入的查新内容,对查新内容进行语义分析,提取出查新关键词,并通过关联检索生成相应的关联关键词;根据查新关键词和所述关联关键词,基于逻辑关系生成查新检索式;根据查新检索式检索各个资源数据库,获得检索结果;对检索结果进行多维度评价,并根据评价结果生成相应的查新报告;其中,多维度评价包括:基于检索内容相关度评价、基于查新点的相关度评价、基于关键词的相关度评价、基于技术指标的相关度评价。采用本发明实施例,能够提高科技查新的效率。
Publication Patent Date: 20160309Application Date: 20151021Publication Patent Number: CN105389344A
Patentee: 北京拓尔思信息技术股份有限公司施水才,程涛
文档图像识别方法,包括图像预处理、获取图像连通区域、连通区域特征抽取、文档图像判别,图像连通区域的获取借助了聚类的思想,应用8连通准则,对灰度值为0和255的像素点分别聚类,准确识别连通区域。连通区域特征包括形状特征、颜色特征,主要分三种方式抽取,依次为疑似字符识别、一致性字符发现、真实字符判断,特征抽取简洁、复杂度低。实现了文档图像的准确、高效的识别,解决了文档图像识别性能低下的问题。
Publication Patent Date: 20160518Application Date: 20141022Publication Patent Number: CN105590082B
Patentee: 北京拓尔思信息技术股份有限公司施水才,姚能俊
本发明提供一种基于通知的跨域单点登录方法,其包括:步骤S1,信任通道建立;步骤S2,全局认证凭证生成;步骤S3,用户身份认证;步骤S4,单点登录。借助web服务器的原有会话机制,以安全的加密通道传递会话ID,在认证服务端维护会话ID与认证凭证的关系,实现身份认证和单点登录,具有效率高、安全性高、实现成本低的特点。此外,本发明还提供一种基于通知的跨域单点登录系统,包括:客户端、应用服务端、认证中心三大模块,任意接入认证中心的应用端需携带重定向组件,认证中心负责认证凭证的生成、管理、销毁等工作,应用服务端与认证中心需建立互信通道,复用web服务的会话特性,实现跨域单点登录,具有复杂度低、安全性高、可靠性强的优点。
Publication Patent Date: 20160518Application Date: 20141022Publication Patent Number: CN105592003B
施水才,曹辉
本发明提供一种可视化的网站建设系统,其包括:站点池,栏目库,资源池,风格池,母版库,可视化设计页面等模块,其中可视化设计页面作为用户接口,将网页拆分成一个个独立的资源块,由其他数据资源模块提供内容、风格支持,可实现用户拖拽设计和可视化数据配置。此外,本发明还提供一种可视化的网站建设方法,该方法将站点池、栏目库以结构树的形式组织管理,预定义资源池、风格池内容,页面设计时直接选择资源块并配置资源块的内容及风格即可,实现了所见即所得的网站建设模式,同时将内容与表现形式剥离,业务处理逻辑透明化,提高了网站建设效率,降低了网站建设的技术门槛。
Publication Patent Date: 20150701Application Date: 20131225Publication Patent Number: CN104750461A
施水才,付成睿
本发明提供的基于OSGI的ETL处理装置,包括:流程设计器和流程执行引擎。其中,流程设计器由节点中心、控制策略和触发器模块组成,流程执行引擎由处理中心、执行策略和流程管理模块组成。任意模块基于OSGI平台,并由其为模块创建独立的运行环境。节点中心负责所有节点及其属性的预定义,控制策略定义了节点间的关系及触发方式,触发器向引擎发送任务请求。处理中心负责任务的执行及执行时的调度,执行策略有单线程串行、多线程并行以及条件判断,实现时基于缓存机制利用数据分发与复制技术。此外,本发明还提供了基于OSGI的ETL处理方法。通过本发明的技术方案,可以有效提高子任务的重用性,提高数据吞吐量及处理效率。
Publication Patent Date: 20150603Application Date: 20131127Publication Patent Number: CN104679482A
王洪俊,肖诗斌,施水才
种海量文档分布式检索排重系统,包括文档预处理模块、文档特征计算模块、分布式建库模块、存储模块、分布式检索模块、相似度计算模块。文档特征计算模块根据词对文档的重要程度计算文档特征向量。分布式建库模块根据文档特征向量将文档映射到不同的存储分区。分布式检索模块检索目标文档所属的若干个分区,相似度计算模块计算目标文档与这若干个分区中所有文档的相似度,从而实现海量文档分布式排重操作。所提供的海量文档分布式检索排重系统和方法,借助了分布式系统的思想,将海量文档集分散到若干个子集中,使得排重计算在1个或少数几个子集中进行,减少了相似度计算量,提高了文档排重效率。
Publication Patent Date: 20140212Application Date: 20120724Publication Patent Number: CN103577418B