实时

LATTE3D

LATTE3D 是由英伟达多伦多AI实验室开发的一种高效生成高质量3D对象的模型。它基于文本描述,能在约400毫秒内生成逼真的3D内容。LATTE3D采用摊销优化方法,增强了对新提示的适应能力。该模型支持文本到3D合成、快速生成、高质量渲染及3D风格化功能,适用于多种应用场景。

Oneimg

文字转图片应用,无需拖拽排版,直接输入内容,一键导出长图。

音鹿

音鹿是一款基于AI技术的音频编辑工具,主要功能包括文字转语音、音色选择、AI翻唱及音频编辑(剪切、合并、混音、音量调节、变速变调)。该工具内置大量音色模型,支持实时预览与参数调整,广泛适用于社交媒体、广告宣传、教育培训等领域,帮助用户高效完成音频创作。

Pipecat

Pipecat是一款开源Python框架,用于构建语音和多模态对话系统。它整合了语音识别、文本转语音及对话处理功能,支持与主流AI平台集成,采用模块化管道架构,提升开发效率。基于帧的实时处理机制确保流畅交互,适用于语音助手、企业服务、教育、医疗及多模态应用等多种场景。

Thetawise

Thetawise 是一款面向学生的 AI 数学辅导工具,支持多种输入方式,可生成详细解题步骤,帮助学生理解数学问题。它提供个性化学习计划、高级求解器、实时聊天支持及学习进度分析等功能,适用于课后辅导、考试准备、自学及远程教育等场景,有效提升数学学习效率。

StreamBridge

StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架,支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略,实现长上下文处理与主动响应。项目配套发布Stream-IT数据集,包含60万样本,适用于多种视频理解任务,展现出在视频交互、自动驾驶、智能监控等领域的应用前景。

YOLOv9

YOLOv9是一款先进的目标检测系统,由台北中研院和台北科技大学的研究团队开发。该系统在YOLO算法系列基础上进行了优化,引入了可编程梯度信息(PGI)和泛化高效层聚合网络(GELAN),显著提升了模型的准确性、参数效率、计算复杂度和推理速度。YOLOv9在多个应用场景中表现出色,包括视频监控、自动驾驶、机器人视觉和野生动物监测。

Hika AI搜索引擎

一款免费的知识获取AI搜索引擎,HIKA为你探索世界提供全新的方式与思路,你提出问题,HIKA会实时搜索网络,深度思考并给出答案。

NPOA

NPOA是一款开源的舆情监测工具,支持实时数据采集、情感分析、话题分类及多渠道媒体分析,适用于企业品牌管理、政府舆论监控、市场研究等多个领域。系统提供预警机制、可视化报告和大屏展示功能,便于用户快速获取关键信息并做出应对。

Avatar IV

Avatar IV 是 HeyGen 推出的 AI 数字人模型,支持用户通过上传照片和语音快速生成逼真视频。该工具基于音频驱动的表情引擎,能精准捕捉语音中的语调、节奏和情感,生成自然流畅的面部表情和动作。操作简单,无需专业技能,适用于多种角色形象,涵盖社交媒体、企业营销、在线教育等多个领域,是高效内容创作的理想选择。