AI工具集
  • 首页
  • AI资讯
  • AI百科
  • AI教程
  • AI名人
  • 排行榜
  • 今日热点
  • 提交AI工具
      • 未登录
        登录后即可体验更多功能
    • 首页
    • AI名人
    • AI教程
    • AI百科
    • AI资讯
    • 排行榜
    • 工具提交
    未登录
    登录后即可体验更多功能

    多模态大模型

    共 15 篇文章
    排序
    发布更新浏览点赞
    报道称DeepSeek V4 与腾讯姚顺雨混元模型 4 月同步发布

    报道称DeepSeek V4 与腾讯姚顺雨混元模型 4 月同步发布

    据《白鲸实验室》独家消息,备受期待的 DeepSeek V4 与姚顺雨新混元模型将于 2026 年 4 月正式发布。DeepSeek V4 是由梁文锋主导研发的多模态大模型,经过长期的打磨与提升,预计...
    AI资讯# DeepSeekV4# 多模态大模型# 姚顺雨
    1周前
    070
    ​阿里通义发布 Fun-CineForge:开源影视级配音大模型,攻克音画同步难题

    ​阿里通义发布 Fun-CineForge:开源影视级配音大模型,攻克音画同步难题

    阿里通义实验室于3月16日正式发布并开源了影视级多场景配音多模态大模型 Fun-CineForge。该模型旨在解决 AI 配音中长期存在的口型不同步、情感表达缺失以及多角色音色不一致等核心痛点,并同步...
    AI资讯# AI新词# 品牌产品词# 多模态大模型
    1周前
    0130
    小红书新款AI编辑模型FireRed-Image-Edit v1.1开源,攻克ID一致性与复杂融合难题

    小红书新款AI编辑模型FireRed-Image-Edit v1.1开源,攻克ID一致性与复杂融合难题

    2026年3月9日,小红书Super Intelligence团队正式发布图像编辑模型FireRed-Image-Edit v1.1。此次更新距离1.0版本发布仅过去不足一个月,标志着小红书在多模态大...
    AI资讯# AI新词# FireRed-Image-Edit# 多模态大模型
    1周前
    0100
    影视配音进入AI时代:通义实验室开源Fun-CineForge,首克多人对话难题

    影视配音进入AI时代:通义实验室开源Fun-CineForge,首克多人对话难题

    传统的 AI 配音在面对影视、动画等高标准场景时,常因难以匹配复杂的情绪爆发和精准口型而遭遇瓶颈。针对这一痛点,通义实验室正式发布并开源了首个影视级多场景配音多模态大模型——Fun-CineForge...
    AI资讯# AI新词# 品牌产品词# 多模态大模型
    1周前
    060
    ​能自主决定何时“思考”!微软发布 Phi-4 15B 开源模型,主打小型化多模态

    ​能自主决定何时“思考”!微软发布 Phi-4 15B 开源模型,主打小型化多模态

    微软近日正式发布了全新的开源权重多模态大模型 Phi-4-reasoning-vision-15B。这款模型最大的技术突破在于其具备“自主决定思考时机”的能力——它能够智能判断任务难度,自主选择是快速...
    AI资讯# Phi-4-reasoning-vision-15B# 多模态大模型# 微软
    1周前
    0100
    前字节视觉大模型 AI 平台负责人潘欣加盟美团 出任多模态AI创新业务负责人

    前字节视觉大模型 AI 平台负责人潘欣加盟美团 出任多模态AI创新业务负责人

    前字节跳动视觉大模型AI平台负责人潘欣已于本周到岗,出任多模态AI创新业务负责人,直接向美团技术委员会汇报。至此,这家市值千亿港元的生活服务巨头在 2025 年“外卖+AI”战略中补齐了最核心的一块算...
    AI资讯# AI新词# 多模态大模型# 美团
    1个月前
    0240
    智源研究院推出全球最强多模态世界模型Emu3.5  一键预测真实世界“下一秒”!

    智源研究院推出全球最强多模态世界模型Emu3.5 一键预测真实世界“下一秒”!

    12月4日,北京智源人工智能研究院正式发布新一代多模态大模型Emu3.5,被誉为“真正理解物理世界的AI”。与以往图像、视频、文本模型各自为战不同,Emu3.5首次实现“世界级统一建模”,让AI从“会...
    AI资讯# AI新词# Emu3.5# 北京智源人工智能研究院
    1个月前
    0190
    智谱开源 GLM-4.6V 系列:106B 原生支持 Function Call,轻量版 9B 免费商用

    智谱开源 GLM-4.6V 系列:106B 原生支持 Function Call,轻量版 9B 免费商用

    智谱正式并上线开源 GLM-4.6V 多模态大模型系列,含基础版 GLM-4.6V(总参106B,激活12B)与轻量版 GLM-4.6V-Flash(9B)。新模型将上下文窗口提升至128k toke...
    AI资讯# FunctionCall# GLM-4.6V# 多模态大模型
    1个月前
    0280
    ​长跑型 AI 登场:Jan 团队发布 Jan-v2-VL,深度优化多步任务执行力

    ​长跑型 AI 登场:Jan 团队发布 Jan-v2-VL,深度优化多步任务执行力

    开源 AI 项目 Jan 团队近日正式推出了全新的多模态大模型 Jan-v2-VL-Max。这款拥有30B 参数的模型并非盲目追求通用性,而是精准锁定在“长周期执行任务”这一核心痛点上,旨在解决 AI...
    AI资讯# AI新词# Jan-v2-VL-Max# LoRA-basedRLVR
    1个月前
    0190
    Jan团队发布Jan-v2-VL-Max!30B多模态模型专攻长周期Agent任务,长序列执行稳超Gemini 2.5 Pro

    Jan团队发布Jan-v2-VL-Max!30B多模态模型专攻长周期Agent任务,长序列执行稳超Gemini 2.5 Pro

    在AI智能体(Agent)向复杂、多步任务演进的关键阶段,开源社区迎来一员新锐猛将。Jan团队今日正式发布 Jan-v2-VL-Max——一款300亿参数的多模态大模型,专为长周期、高稳定性自动化执行...
    AI资讯# AI新词# Jan-v2-VL-Max# 多模态大模型
    1个月前
    0200
    加载更多
    AI工具集
    AI工具集(aitools.cc)专注聚合全球优质AI人工智能工具导航站,涵盖AI写作、文本生成、图片生成、视频处理、代码开发、语音识别等10+领域精选AI应用推荐,每日更新AI工具评测与使用攻略。立即探索1000+款免费与付费AI工具,快速匹配您的需求!

    友链申请 免责声明 关于我们 联系我们 联系删除 工具提交

    扫码加QQ群AI工具集
    扫码加QQ群
    扫码加微信AI工具集
    扫码加微信
    Copyright © 2026 AI工具集 沪ICP备2025121622号 由 OneNav 强力驱动 
    网址
    网址文章软件书籍