ST-Raptor是一个基于大语言模型(LLM)的半结构化AI表格问答工具,它能够处理具有复杂布局的半结构化表格,如财务报告、医疗记录等,并准确回答与表格相关的问题。该工具无需额外微调,结合视觉语言模型(VLM)和树构建算法(HO-Tree),可灵活集成不同的大型语言模型。
1、精确问答:仅需输入Excel格式的表格和自然语言问题,即可生成精确答案。
2、多样化表格支持:支持多种半结构化表格布局,如个人信息表、学术表格、财务表格等。
3、多格式输入:支持从Excel、HTML、Markdown、CSV等多种格式输入表格。
4、无需微调:无需对模型进行额外的微调即可使用。
5、两阶段验证机制:通过两阶段验证机制,确保生成的答案准确可靠,避免错误答案的产生。
6、灵活集成大型语言模型:支持灵活集成不同的大型语言模型,如Deepseek-V3、GPT-4o等,提升问答性能。
7、树构建算法(HO-Tree):通过树构建算法对表格结构进行分析和理解,提高对复杂表格的处理能力。
SSTQA中的102个表格和764个问题是从超过2031个真实世界表格中精心筛选出来的,筛选时考虑了(i)具有半结构化格式的表格,例如嵌套单元格、多行/多列标题、不规则布局,以及(ii)涵盖的19个有代表性的真实场景。
我们列出了10个具有代表性的真实场景如下:
人力资源、企业管理、财务管理、市场营销、仓库管理、学术、日程管理、申请表、教育相关以及销售管理。
下载包含2000多个表格的未过滤数据集:原始数据集。
下载SSTQA基准测试:SSTQA基准测试。
本站AI工具导航站提供的「ST-Raptor」的相关内容都来源于网络,不保证外部链接的准确性和完整性。在2025年09月13日 08时59分22秒收录时,该网站上的内容都属于合规合法,后期网站的内容如出现违规,可以直接联系网站管理员(ai@ipkd.cn)进行删除,AI工具导航站不承担任何责任。在浏览网页时,请注意您的账号和财产安全,切勿轻信网上广告!