当前位置:网站首页>荷兰蒂尔堡大学、联邦大学 | Neural Data-to-Text Generation Based on Small Datasets: Comparing the Added Value of Two Semi-Supervised Learning Approaches on Top of a Large Language Model(基于小数据集的神经数据到文本生成)
荷兰蒂尔堡大学、联邦大学 | Neural Data-to-Text Generation Based on Small Datasets: Comparing the Added Value of Two Semi-Supervised Learning Approaches on Top of a Large Language Model(基于小数据集的神经数据到文本生成)
2022-07-15 13:53:00 【智源社区】
作者:Chris van der Lee, Thiago Castro Ferreira, Chris Emmery,等
简介:本研究讨论了半监督学习与预训练语言模型相结合对数据到文本生成的影响。本研究旨在通过将仅辅以语言模型的数据到文本系统与另外通过数据增强或伪标记半监督学习方法丰富的两个数据到文本系统进行比较来回答问题:当文本生成补充大规模语言模型时:尚不知半监督学习是否仍然有用。结果表明,半监督学习在多样性指标上的得分更高。在输出质量方面,使用伪标记方法扩展具有语言模型的数据到文本系统的训练集确实提高了文本质量分数,但数据增强方法在没有训练集扩展的情况下产生了与系统相似的分数。这些结果表明,即使存在语言模型,半监督学习方法也可以提高输出质量和多样性。

论文下载:https://arxiv.org/pdf/2207.06839.pdf
边栏推荐
猜你喜欢
随机推荐
OSPF experiment in mGRE environment
基于.NET动态编译技术实现任意代码执行
Low EMI, high performance 4-channel LED driver tps61194pwprq1
General business general waste packaging cases
2022第二届网刃杯网络安全大赛-Web
flink的测试sql怎么测试呢,不能每次都使用jar测试吧,那么sqk-client就来了
Tab plus swiper long list scrolling
Probe into parental delegation mechanism from source code
备忘录模式 - Unity
Intel IPU
面试题:谈谈你对AQS 的理解
Flowable query the current user's to-do task method and report an error
Flowable 结束事件EndEvent自定义属性
从源码学习线程池的使用原理及核心思想解析
记一次 .NET 某电厂Web系统 内存泄漏分析
JVM内存模型——运行时数据区的特点和作用
JVM garbage collection -- how to determine whether an object is garbage
MGRE comprehensive experiment
【第二十四题】逻辑闭环(北理工/北京理工大学/程序设计方法与实践/小学期 )
动圈式扬声器过载过程









