首页 > 科技资讯
2025
01-15

开创性多模态图片理解模型 Kimi 正式发布:搭载 1M tokens,颠覆认知体验!

科技资讯
jinting
围观965次
0条评论
发布日期:2025年01月15日 12:38:35

开创性多模态图片理解模型 Kimi 正式发布:搭载 1M tokens,颠覆认知体验!

颠覆视听体验,Kimi 引领多模态图片理解新时代!

   1月15日,月之暗面推出了Kimi多模态图片理解模型API,其中全新的Vision模型——moonshot-v1-vision-preview进一步增强了moonshot-v1模型系列的多模态处理能力。这一更新不仅展示了公司在人工智能领域的持续创新,也为开发者提供了更强大的工具来理解和处理复杂的图像信息。这无疑将推动相关应用在各个领域的快速发展,从社交媒体到医疗健康,都将迎来新的机遇和挑战。

   Vision模型在图像识别方面表现出色,能够精准地识别出图像中的复杂细节和微妙差异。无论是食物还是动物,它都能准确地区分出那些看似相似但实际上有所不同的对象。这一技术的发展无疑为许多领域带来了革命性的变化,特别是在艺术鉴定、医学影像分析以及日常生活的智能辅助方面,其潜力巨大。这不仅提高了工作效率,还让我们的生活变得更加便捷和多彩。

   下图示例中,官方拼凑了16张难以通过人眼区分的蓝莓松饼和吉娃娃图片,交由Vision模型进行识别并按顺序标记图片类型。无论是蓝莓松饼还是吉娃娃,该模型均能精准地进行区分和识别。

   Vision 模型具备高级图像识别能力,在 OCR 文字识别和图像理解场景中,比普通的文件扫描和 OCR 识别软件更加准确,例如收据单 / 快递单等潦草的手写内容都可以准确识别。

   以这张《某学生期末考试成绩》柱状图为例,官方要求模型不仅需要提取和分析考试成绩,还需要从美学风格的角度进行分析。Vision模型不仅可以精确地识别出柱状图中每个科目名称对应的分数数值并进行对比,还可以识别出该柱状图的样式格式和颜色等细节信息。 这样的技术应用不仅展示了人工智能在数据分析领域的强大能力,同时也为教育评估提供了新的视角。通过视觉模型的分析,我们可以更直观地了解学生的学业表现,同时也能更好地发现不同学科之间的差异与关联。此外,从美学角度分析图表设计,有助于提高信息传达的效率和美观度,使教育报告更加吸引人,便于理解。因此,这种技术的应用前景非常广阔,值得进一步探索和发展。

   Vision模型采用按使用量计费的方式,每张图片按照1024个tokens合并计算在输入请求的token使用量中。不同型号的模型,其收费标准也有所不同,具体分类如下:

   Vision 视觉模型支持的特性包括:

   多轮对话

   流式输出

   工具调用

   JSON Mode

   Partial Mode

   以下功能暂未支持或部分支持:

   联网搜索:不支持

   ContextCaching:不支持构建包含图片内容的ContextCache,但可以利用已成功创建的缓存来调用Vision模型。

   URL格式的图片暂不支持,我们目前只接受使用base64编码的图片内容。

   支持组织项目管理功能

   支持一个企业实体认证多账号

   增加 File 文件资源管理功能:直观管理查看文件资源

   优化资源管理列表鼠标悬浮复制

   Context Caching 功能已放开给全量用户

   Cache 续期不再收取创建的费用

本文固定链接: https://kj.wjxc123.cn/arts_content-25086.html 转载请注明出处(科技快讯中文网-kj.wjxc123.cn)
最新发布 商务部新政:手机补贴无需交旧机,线上线下通用!  2025-01-16 15:23:38 全国青少年科技创新大赛宣布:未来,15岁以下少年请等待再参赛!  2025-01-16 14:50:11 美国宣布限制对华16nm及以下制程出口,中国加速自主研发!  2025-01-16 13:38:40 美国出台新规限制对华晶圆代工!背后的战略意图和影响深度揭秘  2025-01-16 12:38:20 2025年中国造船业连续15年独霸全球船舶制造!  2025-01-16 12:18:42 手机国家补贴政策升级!中高端手机销售迎利好,500元补贴不分国产进口  2025-01-16 11:58:47 马斯克再进化:超级智能网页 Grok 登场,不再需要 X 账户  2025-01-16 11:53:55 我国城市轨道交通网络持续扩大,54 城运营线路达 325 条,总里程超过 1 万公里  2025-01-16 08:03:03 云存储大爆发!AI数据创新引领未来风向  2025-01-15 20:24:53 【移民关键!八年后美国人口或负增长】  2025-01-15 19:42:27 广东:新能源汽车、手机产能飙升!创造历史,连续36年第一,GDP突破14万亿  2025-01-15 19:39:14 领先市场的讯飞同传搭载星火语音,AI翻译更上一层楼!  2025-01-15 19:35:55 【手机、平板国补标准大调整!1月20日起最高补贴500元,新规实施】  2025-01-15 19:13:06 数字产品购新补贴细则即将出炉,手机市场或将掀起新一波购买热潮  2025-01-15 19:03:32 日本拨款1600亿日元,助推本土芯片设计产业,冲刺中美巅峰  2025-01-15 19:03:09 广东再创辉煌!连续 36 年问鼎全国 GDP 第一,成为中国首个 GDP 突破 14 万亿大省  2025-01-15 19:02:38 中科团队突破!大肠杆菌成功实现光合作用!  2025-01-15 14:14:22 英伟达 Blackwell 架构巧变:CoWoS-S 需求大幅下降  2025-01-15 13:36:25 开创性多模态图片理解模型 Kimi 正式发布:搭载 1M tokens,颠覆认知体验!  2025-01-15 12:38:35 OpenAI推出ChatGPT的新管理工具,挑战Siri和Alexa的智能对话能力  2025-01-15 12:24:16 我国发明专利数量突破475.6万件,每万人创造14件高价值专利,创全球新纪录  2025-01-15 11:48:03 ChatBird领跑AI陪伴时代,雷鸟助力AI技术走进消费者生活  2025-01-15 11:36:59 全球首款14~16.7英寸OLED卷轴屏笔记本量产!联想新品引领未来技术潮流  2025-01-15 11:09:23 【突破技术边界!星火语音同传大模型发布,达人类专家译员水准】  2025-01-15 10:39:30 苹果研发全新芯片!超越M4 Ultra:首发搭载Mac Pro  2025-01-15 10:30:57
友情链接 百度权重≥5友情链接交换
数界探索  |  智慧科技  |  经济脉动  |  科技先锋  |  财智慧  |  慧算财经  |  财经探秘  |  财经日报  |  今日财经  |  财经风向标
© 2015-2025 科技快讯中文网 甘肃网暻网络科技有限公司 版权所有 备案号:陇ICP备16003923号-3

免责声明:本站所有文章来源于网络或投稿,如果任何问题,请联系339841985@qq.com

网站地图  联系我们  用户投稿  关于我们

页面执行时间0.013034秒