学习

SynthLight

SynthLight是由耶鲁大学与Adobe Research联合开发的基于扩散模型的人像重照明工具,通过物理渲染引擎生成合成数据并结合多任务训练策略,实现高质量的光照效果生成。它能够根据环境光照图重新渲染人像,生成自然的高光、阴影和漫反射效果,并适用于摄影后期、虚拟场景、游戏开发及广告设计等多个领域,具备良好的泛化能力和实用性。

OmAgent

OmAgent是由Om AI与浙江大学滨江研究院联合开发的多模态语言代理框架,支持文本、图像、视频等多种输入形式,简化设备端智能代理的开发流程。它具备高效模型集成、灵活算法接口和复杂任务处理能力,适用于视频监控、内容推荐、教育辅助等场景,提升设备智能化水平和用户体验。

Ai工具集导航 AI

Ai工具集导航(AI-Bot.cn)专注于收录和推荐国内外热门、创意、有趣、前沿的AI工具和网站,致力于为大家提供一个快速访问任意人工智能网站的门户和入口。

Open Materials 2024

Open Materials 2024 (OMat24) 是Meta发布的开源数据集,包含超过1.1亿个无机材料的密度泛函理论(DFT)计算数据,并配备了预训练的图神经网络模型EquiformerV2。该模型在材料的基态稳定性及形成能预测方面具有卓越表现,为新材料的发现和设计提供了高效工具。其核心功能包括大规模数据集支持、高效的材料属性预测以及在多个领域(如能源、环境、催化等)的实际应用潜力。

StreamBridge

StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架,支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略,实现长上下文处理与主动响应。项目配套发布Stream-IT数据集,包含60万样本,适用于多种视频理解任务,展现出在视频交互、自动驾驶、智能监控等领域的应用前景。

Chai

Chai是一款AI伴侣应用,提供强大的内容生成能力和独特的交互体验。用户可以与各种AI角色进行聊天,角色具有不同的性格、背景和对话风格。Chai支持用户创建自定义AI角色,个性化推荐适合的AI角色,并提供数千个预设角色。用户可主导剧情走向,探索成人向内容,享受自由度极高的互动体验。同时,Chai支持多语言交流,适用于AI陪伴、角色扮演、语言学习和情感支持等多种场景。

Miraa

Miraa 是一款由 Myoland 开发的 AI 驱动语言学习工具,支持多种语言的音频和视频内容转录与实时翻译,帮助用户提升语言理解与表达能力。其“回声法练习”功能通过听、理解、模仿和比较提升口语,同时提供 AI 解释、智能推荐、学习进度跟踪等功能。适用于日常学习、旅行准备、专业提升及教学辅助等场景,适合各类语言学习者使用。

QwQ

QwQ-32B-Preview是一款由阿里巴巴开发的开源AI推理模型,具有325亿参数,擅长处理数学与编程领域的复杂任务。它能在多个基准测试中超越同类产品,并提供透明化的推理流程。然而,该模型在语言切换及跨领域应用上存在一定局限性。

EasyOCR

EasyOCR是一款基于深度学习技术的开源OCR工具,支持超过80种语言及多种书写系统。它提供高精度的文字识别能力,用户可通过简单的API轻松地将图像中的文本转换为可编辑的文本。EasyOCR易于安装和使用,支持跨平台操作,并具备批量处理能力。该工具在图像质量有一定要求的情况下,能够高效处理大量图像文件。

天津大学智能与计算学部

天津大学智能与计算学部是在国家全面实施“双一流”建设的背景下,为进一步优化学科布局,促进交叉融合而组建。学部共设四个学院:计算机科学与技术学院、软件学院、网络安全学院、...