5月人工智能方向热门论文 必读论文集
QLoRA: Efficient Finetuning of Quantized LLMs
引用0浏览4692
Enhancing Chat Language Models by Scaling High-quality Instructional Conversations
引用0浏览295
Let’s Verify Step by Step
引用0浏览886
OlaGPT: Empowering LLMs With Human-like Problem-Solving Abilities
引用0浏览280
Top PaperGoogle DeepMind发表新论文,Alpha家族再添一名新成员—AlphaDev,AI重写排序算法,速度快70%,Google DeepMind称AlphaDev将改变计算基础。
Daniel J. Mankowitz, Andrea Michi, Anton Zhernov, Marco Gelmi, Marco Selvi,Cosmin Paduraru, Edouard Leurent, Shariq Iqbal, Jean-Baptiste Lespiau, Alex Ahern, Thomas Köppe, Kevin Millikin, 该研究探索了ChatGPT模型在对话理解领域的能力,并介绍了一个可用于未来研究的对话框架。
arXiv · Computation and Language(2023)
本文介绍了一种新的模型HQ-SAM,该模型可以在保持原模型设计、高效性和零样本泛化能力的同时,准确地分段任何对象,尤其是那些具有复杂结构的对象。
arXiv · Computer Vision and Pattern Recognition(2023)
本文证明了 CoT 在实现大语言模型(LLM)推理中是不可或缺的,并从理论和实验角度揭示了 CoT 如何释放 LLM 的巨大潜力。
arXiv · Machine Learning(2023)
该研究解决了文本到图像扩散模型的计算和速度问题,使其能够在手机设备上在不到2秒的时间内运行,避免了高端GPU和云推理这些成本高昂的方式,同时也规避了隐私问题。
arXiv · Computer Vision and Pattern Recognition(2023)
本文研究了直接在文件字节上进行分类,而不需要在推理时对文件进行解码的方法。使用文件字节作为模型输入可以使模型在多个输入模态上运行。作者成功开发了一个名为ByteFormer的模型,能够直接在文件字节上进行训练和测试,在训练和测试使用TIFF文件字节时,ByteFormer的ImageNet Top-1分类准确率达到77.33%(在RGB图像上操作时为72.2%)。
arXiv · Computer Vision and Pattern Recognition(2023)
OpenAI 最新研究,提出了一种减轻 ChatGPT 幻觉、实现更好对齐的新方法——通过“过程监督”来提高 ChatGPT 等 AI 大模型的数学推理能力。
再推荐几条看看查看更多推荐内容再推荐几条看看添加订阅关键词设定感兴趣领域,获取更精准推送