AI帮你理解科学
对话

58,468,628

科研人员

318,822,210

论文成果

8,796,718

知识概念

1,147,790,347

引用关系
关注
推荐
热点
动态
Top PaperOpenAI 最新研究,提出了一种减轻 ChatGPT 幻觉、实现更好对齐的新方法——通过“过程监督”来提高 ChatGPT 等 AI 大模型的数学推理能力。
Hunter Lightma, Vineet Kosaraj, Yura Burda,Harri Edwards, Bowen Baker , Teddy Lee,Jan Leike,John Schulman,Ilya Sutskever大牛学者
openai (2023)
引用0浏览641
引用
评分
ChatPaper
0
641
Top Paper本文研究了直接在文件字节上进行分类,而不需要在推理时对文件进行解码的方法。使用文件字节作为模型输入可以使模型在多个输入模态上运行。作者成功开发了一个名为ByteFormer的模型,能够直接在文件字节上进行训练和测试,在训练和测试使用TIFF文件字节时,ByteFormer的ImageNet Top-1分类准确率达到77.33%(在RGB图像上操作时为72.2%)。
Maxwell Horton,Sachin Mehta,Ali Farhadi大牛学者,Mohammad Rastegari
arXiv · Computer Vision and Pattern Recognition(2023)
引用0浏览64
引用
评分
ChatPaper
0
64
Top Paper该研究解决了文本到图像扩散模型的计算和速度问题,使其能够在手机设备上在不到2秒的时间内运行,避免了高端GPU和云推理这些成本高昂的方式,同时也规避了隐私问题。
Yanyu Li,Huan Wang,Qing Jin, Ju Hu, Pavlo Chemerys, Yun Fu, Yanzhi Wang,Sergey Tulyakov,Jian Ren
arXiv · Computer Vision and Pattern Recognition(2023)
引用0浏览70
引用
评分
ChatPaper
0
70
本文利用奖励函数和最优策略之间的映射,展示了这个受限的奖励最大化问题可以用单个阶段的策略训练来精确优化,从而在人类偏好数据上解决了一个分类问题,提出了一种称为DPO的算法。DPO算法稳定、高效且计算量轻,无需拟合奖励模型、在微调过程中从语言模型中采样或进行显著的超参数调整。
Rafael Rafailov,Sharma Archit, Eric Mitchell,Stefano Ermon大牛学者, Christopher D. Manning,Chelsea Finn大牛学者
arXiv · Machine Learning(2023)
引用0浏览159
引用
评分
ChatPaper
0
159
本文介绍了一个名为OlaGPT的智能框架,旨在通过模拟人类认知的某些方面来提升大型语言模型(LLMs)在解决复杂推理问题方面的能力。
Yuanzhen Xie, Tao Xie, Mingxiong Lin, WenTao Wei, Chenglin Li, Beibei Kong,Lei Chen, Chengxiang Zhuo, Bo Hu,Zang Li
arXiv · Computation and Language(2023)
引用0浏览230
引用
评分
ChatPaper
0
230
论文提出了一种新的神经网络架构—Backpack语言模型,它结合了强大的建模性能和可解释性控制的接口。
John Hewitt,John Thickstun, Christopher D. Manning,Percy Liang大牛学者
arXiv · Computation and Language(2023)
引用0浏览214
引用
评分
ChatPaper
0
214
英伟达AI智能体接入GPT-4。
Guanzhi Wang, Yuqi Xie, Yunfan Jiang,Ajay Mandlekar,Chaowei Xiao,Yuke Zhu, Linxi Fan,Animashree (Anima) Anandkumar大牛学者
arXiv · Artificial Intelligence(2023)
引用0浏览440
引用
评分
ChatPaper
0
440
讨论了使用强大的专有语言模型来提高较弱的开源语言模型的方法的问题。
Arnav Gudibande,Eric Wallace, Charlie Snell,Xinyang Geng,Hao Liu, Pieter Abbeel,Sergey Levine大牛学者,Dawn Song大牛学者
arXiv · Computation and Language(2023)
引用0浏览127
引用
评分
ChatPaper
0
127
在文本转3D生成中,使用预训练的大规模文本-图像扩散模型进行分数蒸馏采样(SDS)存在过度饱和、过度平滑和低多样性等问题。作者提出采用随机变量模拟3D参数,引入粒子群体和变分分数蒸馏(VSD)框架,解决了这些问题,提高了生成样本的多样性和质量。文章还介绍了一些相关设计空间的改进,形成了一个名为ProlificDreamer的文本转3D生成方法。
arXiv · Machine Learning(2023)
引用0浏览201
引用
评分
ChatPaper
0
201

再推荐几条看看查看更多推荐内容再推荐几条看看添加订阅关键词设定感兴趣领域,获取更精准推送

ChatPaper
对话式文献知识库
选择论文开启对话
Symposium on Large Language Models丨IJCAI'23
Important Dates
Submission deadline: June 3, 2023
Acceptance notification: Jun. 15, 2023
Camera-ready version due: Jun. 30, 2023
Venue: Sheraton Grand Macao Hotel, Macau
Call for Papers
Techniques
Applications
Challenges
期待在IJCAI 2023与您相见!