这一任命不仅是金驰个人学术生涯的重要里程碑,更是对他在机器学习理论领域所做出的基础性贡献的高度认可,这些贡献为当前 LLM的崛起提供了关键的数学基石。 与此同时,随着强化学习因其在复杂控制和 AI 对齐中的…...
最近,谷歌的研究团队在NeurIPS 2024发布了一个新方法叫SLED(Self Logits Evolution Decoding),目标是:不依赖外部知识,不再额外微调,而是让模型自己用好内部的知识,…...