Top Paper OpenAI 最新研究,提出了一种减轻 ChatGPT 幻觉、实现更好对齐的新方法——通过“过程监督”来提高 ChatGPT 等 AI 大模型的数学推理能力。
Top Paper 本文研究了直接在文件字节上进行分类,而不需要在推理时对文件进行解码的方法。使用文件字节作为模型输入可以使模型在多个输入模态上运行。作者成功开发了一个名为ByteFormer的模型,能够直接在文件字节上进行训练和测试,在训练和测试使用TIFF文件字节时,ByteFormer的ImageNet Top-1分类准确率达到77.33%(在RGB图像上操作时为72.2%)。
arXiv · Computer Vision and Pattern Recognition(2023)
Top Paper 该研究解决了文本到图像扩散模型的计算和速度问题,使其能够在手机设备上在不到2秒的时间内运行,避免了高端GPU和云推理这些成本高昂的方式,同时也规避了隐私问题。
arXiv · Computer Vision and Pattern Recognition(2023)
本文利用奖励函数和最优策略之间的映射,展示了这个受限的奖励最大化问题可以用单个阶段的策略训练来精确优化,从而在人类偏好数据上解决了一个分类问题,提出了一种称为DPO的算法。DPO算法稳定、高效且计算量轻,无需拟合奖励模型、在微调过程中从语言模型中采样或进行显著的超参数调整。
arXiv · Machine Learning(2023)
本文介绍了一个名为OlaGPT的智能框架,旨在通过模拟人类认知的某些方面来提升大型语言模型(LLMs)在解决复杂推理问题方面的能力。
Yuanzhen Xie , Tao Xie , Mingxiong Lin , WenTao Wei , Chenglin Li , Beibei Kong , Lei Chen , Chengxiang Zhuo , Bo Hu , Zang Li arXiv · Computation and Language(2023)
论文提出了一种新的神经网络架构—Backpack语言模型,它结合了强大的建模性能和可解释性控制的接口。
arXiv · Computation and Language(2023)
arXiv · Artificial Intelligence(2023)
讨论了使用强大的专有语言模型来提高较弱的开源语言模型的方法的问题。
arXiv · Computation and Language(2023)
在文本转3D生成中,使用预训练的大规模文本-图像扩散模型进行分数蒸馏采样(SDS)存在过度饱和、过度平滑和低多样性等问题。作者提出采用随机变量模拟3D参数,引入粒子群体和变分分数蒸馏(VSD)框架,解决了这些问题,提高了生成样本的多样性和质量。文章还介绍了一些相关设计空间的改进,形成了一个名为ProlificDreamer的文本转3D生成方法。
arXiv · Machine Learning(2023)
再推荐几条看看 查看更多推荐内容 再推荐几条看看 添加订阅关键词 设定感兴趣领域,获取更精准推送