TPO TPO(Test-Time Preference Optimization)是一种在推理阶段优化语言模型输出的框架,通过将奖励模型反馈转化为文本形式,实现对模型输出的动态调整。该方法无需更新模型参数,即可提升模型在多个基准测试中的性能,尤其在指令遵循、偏好对齐、安全性和数学推理等方面效果显著。TPO具备高效、轻量、可扩展的特点,适用于多种实际应用场景。 AI项目与工具 2025年06月12日 83 点赞 0 评论 667 浏览
小恐龙公文排版助手 一款专为Word和WPS设计的插件,主要功能是帮助用户快速完成文档排版。除了适用于政府机关常见的15种公文,也可以广泛用于各类规范文本的排版。 Ai办公效率 2025年06月05日 53 点赞 0 评论 677 浏览
Operator Operator是由OpenAI开发的AI工具,基于Computer-Using Agent(CUA)模型,能够模拟人类操作网页浏览器,完成如预订、购物、表单填写等任务。它结合了GPT-4o的视觉识别能力和强化学习的推理能力,支持多任务处理和个性化设置。具备自我纠错、安全防护及隐私保护机制,在涉及敏感信息时会请求用户接管。适用于自动化购物、数据分析、日程安排等多种场景。 AI项目与工具 2025年06月12日 10 点赞 0 评论 678 浏览
UVR5 UVR5,终极人声去除器,使用先进的 AI技术,从音视频提取伴奏,简单易用、无需注册即可使用来获取高质量的伴奏和其他音轨文件。 Ai语音工具 2025年06月05日 96 点赞 0 评论 681 浏览
Searcholic AI驱动的电子书和文档搜索引擎,,让用户能够轻松搜索、发现和访问各种来源的各种电子书和文档,包括学术论文、研究文章、技术文档、小说等。 Ai办公效率 2025年06月05日 72 点赞 0 评论 689 浏览