表格问答模型的生成式预训练新方法
使用表格数据的问答模型的改进问答模型有时需要从表格中检索信息而表格使用的语义线索与自由格式文本完全不同。历史上大多数基于表格的问答工作都集中在提取单个表格单元格的内容作为问题的答案。但有时提问者需要更多上下文来理解答案因此近期关于表格问答的研究已经探索了将表格数据嵌入到句子或句子序列中的可能性。到目前为止最成功的模型是端到端的神经模型该模型将问题和表格作为输入并输出问题的自由格式答案。在今年的AAAI会议上我们提出了一种训练基于表格的自由格式问答模型的新方法该方法在针对真实问答数据集进行微调之前先在合成数据上对模型进行预训练。该模型被称为GenTaP即面向生成的基于表格的中间预训练。该模型在两个目标上同时进行预训练一个是对问题的句子式答案另一个是从单个表格单元格中提取的答案通常是名称或数字。在实验中将该模型与之前的四个端到端模型在五个不同的指标上进行了比较该模型在所有指标上均表现最佳根据BLEU指标相比之前的最优模型提升了14%。数据增强该方法的关键在于生成无需人工参与的合成训练数据以提高预训练流程的效率。为了生成长篇的训练样本识别包含表格的在线文档。从这些文档中提取包含至少两个共享表格中同一行的单元格值的句子。然后使用一个独立的机器学习模型将这些句子转换成问题。作为输入问题生成模型接收一个句子和表格中的相应条目。为了训练该模型使用了一个现有的用于训练阅读理解模型的数据集该数据集包含问题以及提供回答问题所需信息的文档摘录。只是反转了输入和输出之间的关系。问题生成器的输出为我们提供了可用于预训练问答系统的数据三元组集合表格、问题和答案。表格被转换成字符串其中行之间用特殊字符分隔并附加到问题之后作为输入。然后问答模型学习预测答案。除了长篇答案外还用自动生成的问题-答案对来训练模型其中每个答案由表格中的单个单元格值组成。使用一个简单的语法生成这些问答对该语法是一组短语和句子模板从表格中随机采样数据来生成新句子。在预训练期间使用相等数量的长篇和短篇示例。这样做的目的是长篇目标提高问答模型输出的连贯性而短篇目标则提高其事实准确性。实验表明在预训练期间省略短篇目标确实会略微降低模型在测试集上的性能。该模型本身是一个编码器-解码器模型带有两个解码器分别对应两个不同的输出目标。结果在合成数据上对模型进行预训练后使用一个手工标注的问答数据集对其进行了两项实验。在第一项实验中直接测试了预训练模型在数据集测试样本上的表现未进一步微调这是一个零样本实验。在第二项实验中首先在数据集的训练集上对模型进行微调然后重新进行测试。作为基准使用了四个基于T5语言模型的模型和第五个基于BART语言模型的模型。使用了五种不同的评估指标BLEU指标衡量模型输出与手工标注数据集中的目标输出之间的重叠程度三个ROUGE指标均衡量输出与目标之间的短语重叠程度以及METEOR指标它在评估句子匹配时会考虑同义词和词根共享。该模型在所有指标上均表现最佳BLEU分数比第二好的模型基于BART高出14%在其他四个指标上则提高了5%到10%。零样本模型的表现优于基于小型T5语言模型构建的基准模型尽管该T5基准是在数据集的完整训练集上训练的。并且零样本模型的表现仅略逊于基于基础T5模型构建的基准。还在一个不同的任务上测试了预训练模型基于表格数据生成特定领域的句子而非问题答案且训练样本数量有限。在该任务上该模型优于两个基于GPT语言模型的基准表明该方法可能也能很好地适应其他应用。FINISHED更多精彩内容 请关注我的个人公众号 公众号办公AI智能小助手或者 我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享

相关新闻

Java拼班神器:体育课程外卖轻松约

Java拼班神器:体育课程外卖轻松约

Java通过智能匹配算法、实时协作工具与云原生架构,为体育拼班系统赋予了“外卖式”便捷服务能力,实现课程按需匹配、资源高效协同与用户体验优化,具体体现在以下几个方面:一、技术内核:Java生态的三重支撑跨平台兼容性…

2026/7/4 21:02:33 阅读更多 →
Java赋能拼课:体育外卖式服务新体验

Java赋能拼课:体育外卖式服务新体验

Java通过其强大的技术生态,为体育拼班系统构建了“外卖式”便捷服务,实现了课程按需匹配、资源高效协同与用户体验优化,开启了体育教育个性化新时代。以下是Java赋能拼班系统,打造体育外卖式服务新体验的核心要点:一、…

2026/7/3 7:52:26 阅读更多 →
Java礼物系统:打造个性化赠礼新体验

Java礼物系统:打造个性化赠礼新体验

Java礼物系统:打造个性化赠礼新体验在数字化社交与电商融合的背景下,传统赠礼模式逐渐被个性化、互动化的体验取代。Java礼物系统凭借其强大的技术架构与灵活的功能设计,能够深度整合用户画像、智能推荐与社交互动,为赠礼场景提供…

2026/5/17 6:47:16 阅读更多 →

最新新闻

NCM加密音乐文件本地化转换方案:从原理到自动化实践

NCM加密音乐文件本地化转换方案:从原理到自动化实践

1. 项目概述:从“加密枷锁”到“自由播放”如果你是一个音乐爱好者,尤其是网易云音乐的重度用户,那么你大概率在电脑的某个角落发现过一些以.ncm为后缀的奇怪文件。这些文件直接双击无法用常规播放器打开,想导入手机或车载U盘更是…

2026/7/5 9:32:39 阅读更多 →
RevokeMsgPatcher防撤回补丁:原理、风险与Windows微信/QQ/TIM实操指南

RevokeMsgPatcher防撤回补丁:原理、风险与Windows微信/QQ/TIM实操指南

1. 项目概述:为什么我们需要一个“防撤回补丁”? 在即时通讯软件里,“消息撤回”功能设计的初衷是给用户一个纠正错误的机会,比如打错字、发错人或者一时冲动说了不合适的话。但很多时候,这个功能也带来了信息不对等的…

2026/7/5 9:28:38 阅读更多 →
Folia:全屏沉浸式在线音乐播放器,多端体验+AI 主题生成带来独特听歌感受!

Folia:全屏沉浸式在线音乐播放器,多端体验+AI 主题生成带来独特听歌感受!

Folia 是一款以全屏沉浸式歌词播放为核心的在线音乐播放器,支持多平台,具备智能歌词匹配、AI 生成配色主题等功能,为用户带来独特听歌体验。项目亮点与特色Folia 支持网易云、navidrome 和本地音乐库。其独特之处在于智能歌词匹配&#xff0c…

2026/7/5 9:26:38 阅读更多 →
SQL注入攻防全解析:从原理到实战,掌握Web安全核心漏洞

SQL注入攻防全解析:从原理到实战,掌握Web安全核心漏洞

1. 项目概述:为什么SQL漏洞是面试官的“心头好”? 干了这么多年安全,也面过不少人,我发现一个挺有意思的现象:无论你是应聘渗透测试、安全开发还是安全运维,面试官几乎都会把SQL注入漏洞拎出来问一遍。从“…

2026/7/5 9:26:37 阅读更多 →
Weex架构安卓商城APP逆向工程包:含完整源码结构、APK资源解包与AndroidX/Support双兼容支持

Weex架构安卓商城APP逆向工程包:含完整源码结构、APK资源解包与AndroidX/Support双兼容支持

本文还有配套的精品资源,点击获取 简介:一套真实上线商城App的逆向分析成果,主逻辑基于Weex框架(main.js驱动),集成weex-main-jsfm.js、weex-rax-api.js等核心运行时模块,支持RAX组件开发&am…

2026/7/5 9:20:36 阅读更多 →
山东大学编译原理PL0实验代码:Java实现的词法扫描、递归下降语法分析与P-code解释器

山东大学编译原理PL0实验代码:Java实现的词法扫描、递归下降语法分析与P-code解释器

本文还有配套的精品资源,点击获取 简介:一套开箱即用的PL/0语言编译器教学实现,基于Java开发,完整覆盖编译流程三大阶段:词法分析通过GETSYM函数识别关键字、标识符、数字和分界符;语法分析采用递归下降…

2026/7/5 9:18:36 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻