实时

EasyOCR

EasyOCR是一款基于深度学习技术的开源OCR工具,支持超过80种语言及多种书写系统。它提供高精度的文字识别能力,用户可通过简单的API轻松地将图像中的文本转换为可编辑的文本。EasyOCR易于安装和使用,支持跨平台操作,并具备批量处理能力。该工具在图像质量有一定要求的情况下,能够高效处理大量图像文件。

StreamBridge

StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架,支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略,实现长上下文处理与主动响应。项目配套发布Stream-IT数据集,包含60万样本,适用于多种视频理解任务,展现出在视频交互、自动驾驶、智能监控等领域的应用前景。

Fast GraphRAG

Fast GraphRAG是微软推出的一款高效知识图谱检索框架,结合了RAG技术和知识图谱,用于提升大型语言模型在处理私有数据和复杂数据集时的表现。它具备可解释性、高精度、动态数据支持及实时更新能力,适用于多种应用场景如智能问答、企业知识管理、个性化推荐、医疗健康信息检索以及金融分析等领域。

Documate

Documate是一款针对站内文档问答的开源 AI 工具,旨在将 AI 聊天对话框无缝嵌入到您的网站之中。

腾讯混元游戏

腾讯发布的混元游戏视觉生成平台,这是依托混元大模型打造的首个工业级AIGC游戏内容生产引擎,可以优化游戏资产生成与游戏制作流程。

Manus Slides

Manu发布的新功能。它可以通过单个提示快速生成结构化的PPT,通过 Manus 强大的AI代理能力,可自动生成与主题匹配的PPT结构,并优化内容布局。

PulpMiner

一款将网页数据实时转化为JSON API的工具,用户粘贴网页 URL 并指定 JSON 结构,AI 自动提取数据并格式化。

Skyo

Skyo是一款基于天工AI大模型技术的智能语音对话助手,具备快速响应、多语言对话、实时打断、情感化回应及个性化记忆等功能。它能根据用户情绪提供拟人化回复,并支持长时间对话和个性化声音定制。Skyo可应用于情感陪伴、个性化交互、多语言客服、时事新闻聊天、教育辅助和生活助理等多个场景,旨在为用户提供高质量的互动体验。

Emote

Emote是一款基于AI技术的智能笔记工具,支持实时语音转录、情感分析及关键词提取等功能。它能帮助用户记录生活、管理时间、分析消费习惯,并提供私人笔友服务以实现情感支持。同时,Emote允许用户自定义笔记本和标签,满足个性化需求。

CausVid

CausVid是一种由Adobe和MIT联合开发的实时视频生成技术,基于自回归生成模型和蒸馏预训练技术,实现了低延迟、高效率的视频创作。其核心功能包括即时视频生成、快速流式生成、零样本图像到视频转换、视频风格迁移、长视频生成以及交互式剧情生成等。CausVid通过分布匹配蒸馏、非对称蒸馏策略和滑动窗口机制等技术手段,优化了视频生成的质量与稳定性,适用于内容创作、新闻报道、教育培训、游戏开发及广告营