R

SlidesPilot

用户输入他们的主题或文本,几秒钟内就收到结构良好的PPT演示文稿。SlidesPilot 还可以利用 AI 的强大功能将您的 PDF 和 Word 文件转换为演示幻灯片。

AI外教

AI外教是一款利用人工智能技术的虚拟外教口语学习应用,提供个性化的一对一口语练习、实时语法纠错、发音评分及专项备考功能,覆盖雅思、考研、四六级等多种考试题库。此外,它还结合哈佛系统课和CEFR分级体系,帮助用户循序渐进地提高英语口语能力,同时提供翻译、写作辅助等智能工具。 ---

TextHarmony

TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型,擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术,支持视觉文本生成、编辑、理解及感知等功能,广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练,TextHarmony在视觉与语言生成任务中表现出色。

AndroidLab

AndroidLab 是一款面向 Android 自主代理的训练与评估框架,集成了文本和图像模态操作环境,提供标准化的基准测试任务。它通过支持多种模型类型(LLMs 和 LMMs),覆盖九个应用场景的 138 项任务,有效提升了开源模型的性能。此外,AndroidLab 提供了丰富的评估指标和操作模式,助力研究者优化模型表现并推动开源解决方案的发展。

HunyuanVideo

HunyuanVideo是一款由腾讯开源的视频生成模型,具备130亿参数量,支持物理模拟、高文本语义还原、动作一致性和电影级画质等功能。它通过时空压缩的潜在空间训练,融合Causal 3D VAE与Transformer架构,实现图像和视频的统一生成,广泛应用于电影制作、音乐视频创作、游戏开发以及教育等领域。

ZipWP

ZipWP是一个利用AI技术帮助用户创建无需编码的WordPress网站,使用ZipWP可以自动化网站设计、内容和拖放网页自定义。​

StreamBridge

StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架,支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略,实现长上下文处理与主动响应。项目配套发布Stream-IT数据集,包含60万样本,适用于多种视频理解任务,展现出在视频交互、自动驾驶、智能监控等领域的应用前景。

AI头号玩家

"AI头号玩家"是一个分享AIGC实用技巧和资讯,以及与人工智能相关的内容的网站。

Qwen

Qwen-Agent 是基于通义千问模型的开源 Agent 开发框架,支持指令遵循、工具使用、记忆能力、函数调用、代码解释器和 RAG 等功能,能够处理大规模上下文并快速开发复杂 AI 应用。其技术优势包括大语言模型、工具集成、智能代理架构和 RAG 算法,适用于客户服务、个人助理、教育学习、内容创作和技术支持等多个场景。

DynaMem

DynaMem是一款由纽约大学与Hello Robot共同研发的动态空间语义记忆系统,旨在应对开放环境下的移动操作挑战。该系统通过构建特征点云来存储环境信息,并利用RGBD观测数据动态调整记忆库。它支持文本查询定位物体,同时具备强大的动态物体处理能力,广泛应用于家庭、工业、仓储管理以及灾难救援等多个领域。