Work Introduce

工作介绍

FinMoss1.0是一款基于多模型融合的金融知识对话系统。该系统通过交叉使用生成模型和检索模型,能够更加自然、快捷地回复用户提出的各种金融问题。其中,生成模型可以基于上下文和知识库生成更加复杂的回复,而检索模型则能够通过快速匹配历史问题和答案来提供高效的回复。通过结合两种模型的优点,该系统可以提供更加准确、全面和人性化的金融知识问答服务。

整个系统分为输入层、混合模型层和输出层三个部分。输入层接收用户输入的自然语言问题,并进行语义解析和词嵌入,然后将解析结果传送给混合模型。混合模型由意图识别网络、闲聊生成网络、知识检索网络三部分组成。首先,对用户的输入进行意图识别,判断当前的输入是闲聊还是知识问答;如果是闲聊,则调用闲聊生成网络,否则调用知识检索网络。在闲聊生成网络中,根据用户的输入生成相应的对话;在知识检索网络中,先利用pysparnn算法召回最相似的k个问题,再将输入及这k个问题送入孪生神经网络中排序得到最相似的问题,最后提供答案或者引导用户进一步确认问题的细节。输出层将闲聊网络生成的结果或知识问答网络匹配的结果转换成自然语言输出,供用户直接查看或输入下一轮问题。另外,该系统还配备了一个知识库,其中包含大量的针对各种金融问题的详尽信息,不仅提供可靠的信息源,而且可增强检索和生成模型的性能,使系统更快、更全面地回答用户的问题。

另外,该系统还收集了一个数据库(FinMOSS QA 1.0),其中包含大量的针对各种金融问题的详尽资料。知识库不仅提供了一种可靠的信息源,而且可以增强检索和生成模型的性能,使系统能够更快、更全面地回答用户的问题。

FinMOSS在线体验:https://finmoss.cn

本团队研发中小微企业大数据平台“易查猫”(官网:点击进入易查猫官网)。截止目前,已入数据库企业规模已达 1.3 亿多家(基本覆盖全国 95% 企业)企业工商数据、2 亿企业董监高人员信息,以及数百万家企业的司法涉诉信息,提供“全面、实时、准确”的大数据(企业基本工商数据和股权穿透数据)查询服务。

易查猫是一款基于云计算和大数据技术的智能金融数据引擎,它的主要功能是为用户提供全面、迅速、可靠的金融数据查询与分析服务。易查猫整合了多个数据源,包括全球多个市场的上市公司数据、行情数据、基金数据等,这些数据不断更新和扩充,用户可以在易查猫平台上获取到最新的金融信息。

易查猫提供了丰富的数据查询和分析功能,包括公司基本信息查询、股票行情查询、财务数据查询、基金信息查询、基金组合分析等。用户可以通过易查猫进行多维度的数据分析,抽象出重要的趋势和洞察,从而为投资决策、风险评估等提供有力的数据支撑。

易查猫还提供了自定义报表生成和数据可视化展示功能,用户可以根据自己的需求创建各种类型的报表,以及通过可视化图表和图形展示数据,使数据分析更加直观、互动和易于理解。

易查猫的金融数据查询和分析功能被广泛应用于金融研究、投资决策、风险评估等领域,为用户提供了高质量的数据服务和价值。

企业风险又称经营风险,国资委发布的《中央企业全面风险管理指引》(以下简称《指引》)对企业风险的定义是:“未来的不确定性对企业实现其经营目标的影响。” 企业风险按其内容不同可分为市场风险、产品风险、经营风险、投资风险、外汇风险、人事风险、体制风险、购并风险、自然灾害风险、公共危机、政策风险、外交风险等。

企业经营风险是从风险产生的根源看,可分为可控风险和不可控风险,可控是指是否人为可控。那么,可控风险中的人为因素是什么呢?由于有不同利益的偏好,不同的人对风险的意识、对风险的态度就不一样。

本团队长期致力于企业风险预测相关研究工作,目前已经有相应的研究成果,并且公开发布中小型企业破产预测数据集SMEsD。本项目github链接:Bankruptcy Prediction via Mixing Intra-Risk and Spillover-Risk

SMEsD包括2014 - 2021年,由4229家中国中小企业和相关人员组成。从2000年到2021年,所有企业的基本业务信息和诉讼事件都有关联。

相关论文地址:Bankruptcy Prediction via Mixing Intra-Risk and Spillover-Risk

金融科技英译为Fintech, 是 Financial Technology 的缩写,可以简单理解成为Finance(金融)+Technology(科技),指通过利用各类科技手段创新传统金融行业所提供的产品和服务,提升效率并有效降低运营成本。

根据金融稳定理事会(FSB)的定义,金融科技主要是指由大数据、区块链、云计算、人工智能等新兴前沿技术带动,对金融市场以及金融服务业务供给产生重大影响的新兴业务模式、新技术应用、新产品服务等。

近年来,深度学习方法提供了一种进行端到端学习的自然语言处理新思路。本实验室在积极关注和开展了相关技术在机器翻译、句法分析、自动问答等方面的研究。相关工作包括:

改进端到端学习过程:通过对翻译过程的理解和先验知识对端到端学习过程进行改进,包括引入新的网络结构、设计新的优化目标函数等;

引入结构化信息:向基于序列的生成过程中加入层次结构的信息,使得机器对文本的理解过程与传统语法分析过程更加接近;

文本表示方法:研究在深度学习环境下对单词、短语、句子、篇章等语言单元的表示问题,以提高在这些表示形式基础上进行进一步自然语言处理的性能;

端到端其他任务:研究在句法分析、自动问答等可以基于序列进行建模的问题上进行端到端学习的方法和技术。

知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。

知识图谱,它能为学科研究提供切实的、有价值的参考。