青年创业网

首页

新年祝福语

联系我们

会员中心

首页 > AI资讯 > AI头条

AI写作神器

AI原创论文写作

AI计划书写作

AI思想汇报写作

AI调研报告写作

AI期刊论文写作

AI实验报告写作

AI长篇小说写作

最新文章

热门搜索

Chat gpt人工智能网页版国内使通义万相软件下载地址及AI绘画创作软蛙蛙写作软件下载链接及AI写作软件推多模态大模型推动AI迈向“通感”时代巨人网络与阿里云达成“游戏+AI”全抢抓大模型机遇助力AI产业高质量发美团入股智谱AI 纷享销客战略融资大模型商业化落地成焦点，办公场景应用华为正式发布盘古大模型3.0 探索用如何应对ChatGPT带来的机遇和挑

标准化CRM

AI智能对话

AI智能对话系统

大型CRM

AI长篇写作

AI一键生成万字文档

CRM定制开发

AI智能视频

自动剪辑，自动发布视频

炎黄AI注册

免费获取体验账号

两家初创公司Decart和Etched宣布，不用游戏引擎，AI就可以自动生成游戏

AI头条· 2024-11-05 11:30:55

无需游戏引擎，视频基座模型直出实时交互可玩的Minecraft，初创公司Decart和Etched打造的Oasis已经做到了这一点。

现在，不用游戏引擎，AI就可以自动生成游戏了？

今天，两家初创公司Decart和Etched宣布，他们打造了一款世界上首个实时、可玩、可交互的世界模型——Oasis。

Oasis经过了数百万小时游戏视频的训练，仅接收用户的键盘输入即可实时生成开放世界游戏，但其中并不包含任何游戏引擎，只有一个AI基座模型。

游戏允许玩家进行移动、跳跃、拾取物品、打破砖块等操作，生成的视频内容中不仅包含图形学的渲染，也能体现出对物理原则和游戏规则的理解。

在没有任何延迟的情况下，Oasis在H100上运行时能以360p的分辨率实现每秒20帧的渲染，并实时生成视频交互内容。

此前，虽然谷歌已经发布了首个AI游戏引擎GameNGen，但并没有在发布论文后开源。

然而，此次两家初创联手研发的Oasis不仅开源了代码，还公开了500M参数版本的模型权重。

https://github.com/etched-ai/open-oasis

https://huggingface.co/Etched/oasis-500m/tree/main

此外，官网上已经放出了游戏demo，感兴趣的玩家从项目官网进入即可在网页端试玩，体会一下复刻Minecraft的画风。

项目网址：https://oasis.decart.ai/

虽然全AI生成是一大亮点，但在动辄4K HDR的的今天，360p的分辨率显得相当复古，可能对2024年的人类双眼不太友好。

幸好，如果在Etched打造的Sohu芯片上运行100B+参数的优化模型，就能达到4K级别的实时渲染，并发用户数量也将提升超过10x。

就在模型发布的今天，红杉资本也宣布以2100万美金投资Oasis背后的其中一家初创公司Decart。

虽然Oasis看起来是一个游戏，但事实上，真正的技术重点却是「视频」和「交互」。

OpenAI今年发布的Sora可以说是视频模型的「第一枪」。随着视频模型开始扩展，它们正在学习代表整个物理世界和游戏，从而赋能一个全新的产品类别。

从短视频社交媒体到视频通话，再到流媒体，目前超过70%的互联网流量来自视频；但另一方面，视频的数据密集程度相当高，AI生成视频所需的FLOPs比文本或图像多出10×。

因此，大部分人工智能推理工作负载将来自视频。无论是游戏、教育还是生成式内容，大型、低延迟、交互式的视频模型将成为下一波人工智能产品的核心。

01 Oasis是如何炼成的

之前谷歌推出的GameNGen本质上仍是一个由AI驱动的游戏引擎，但Oasis的底层机制并不是游戏引擎，而是单一的视频生成模型，相当于一个能交互、可玩的Sora。

那么，Oasis究竟是如何做到的？

根据博客介绍，技术团队进行了数百次架构和数据实验，以确定用于快速生成自回归交互式视频的最佳架构。

Oasis模型均基于Transformer架构，由基ViT的变分自动编码器（VAE）和基于DiT的潜在扩散主干组成，使用了加速过的轴向、时空和因果注意力机制来克服长序列中的模型发散（divergence）。

Oasis的ViT+DiT架构

你可以简单把它理解一个分工明确的工厂，各个组件各司其职。

VAE就像是工厂里负责整理和识别原材料（游戏里的各种信息）的车间，它基于ViT（Vision Transformer）架构，能够对看到的游戏画面的相关信息进行加工整理。

主干即工厂的核心生产线，基于DiT（Diffusion Transformer）架构，负责将加工处理好的信息产出游戏内容，比如游戏场景、物体等。

同时，利用Decart的推理引擎，结合Etched公司的Sohu（Transformer架构的ASIC）芯片，实现了实时视频生成。

这种架构选择保证了在Sohu芯片上的稳定扩展和快速推理，并且以自回归方式生成帧，能够根据游戏输入实时交互。

Sora这类模型根据用户输入的文本内容直出视频，但Oasis使用Diffusion Forcing进行训练，每次只生成一帧，根据游戏输入在token级别调节每个帧，因此可操纵性很高。

之所以能够被称为「世界模型」，是因为Oasis已经能够了解复杂的游戏机制，例如理解物体和建筑、照明的物理规律等等。

模型理解照明的物理原理

放置立方体砖块

不过，在生成游戏画面的时候，还有一个问题就是如何保证时间稳定性。因为在自回归模型中，一个画面出错了，后面可能就会越来越乱，如同多米诺骨牌一样。

解决这个问题需要长上下文生成方面的创新，Oasis的方案是部署动态噪声（dynamic noising）。

Decart团队也表示，未来将针对部分远处物体出现模糊、不确定对象的时间一致性等问题进行研究，逐步提升Oasis的游戏体验。

02 两家初创，强强联手

生成式交互体验新纪元这就来了吗？这两家初创公司又是什么来头？

据公开报道，Oasis模型是由Decart和Etched两家初创公司共同推出的。

Decart成立于2023年9月，一直致力于提高AI模型的效率和降低运行成本，提供更快、更可靠的训练以及实时推理，成立三个月后便与一家GPU云服务商达成了数百万美元的交易。

Decart联合创始人Moshe Shalev和Dean Leitersdorf

今天，红杉资本更是豪掷2100万美金对其进行了投资，合伙人Shaun Maguire更是大力称赞Decart的团队，认为他们是「超精英的AI工程师」、「合作过的技术最有天赋的团队之一」，正在将生成式体验推向极致。

目前推出的Oasis只是一个实时推理方面的热身实验，接下来的几个月，他们还将发布更具有颠覆性的成果。

另一家初创Etched是来自美国的人工智能芯片公司，成立于2022年，三位核心创始人均为哈佛辍学生。

他们最耀眼的成绩，就是推出了Sohu——世界上第一个基于Transformer架构的ASIC芯片，专为LLM推理加速打造，不仅快过Groq，也能碾压英伟达最新的B200。

以Llama 70B模型的推理性能为例，1张Sohu≈20张H100≈10张B200。

令人咂舌的性能背后，是Etched的一场豪赌般的权衡。

打造针对特定算法的AI芯片，将模型架构直接烧录到芯片的硬件结构中，这意味着无法运行其他模型，比如CNN、RNN或LSTM，但对Transformer来说，就能得到有史以来最快的芯片。

2022年，创始团队大胆预言——Transformer将占领世界，于是投入花了两年时间研发，得到了今天的Sohu。

Etched创始人之一Gavin Uberti表示，「我们正在押注人工智能领域最大的赌注——一种只能运行Transformer模型的芯片，但其运行速度比GPU快几个数量级。也许注意力确实是你所需要的全部...」

能高效推理的AI芯片，对于极耗算力的视频生成而言，可以说是类似于Scaling Law的福音。

虽然文生视频模型已经达到了很好的生成效果，但速度非常慢，成本也很高。

视频中的每个帧包含数百甚至数千个token，必须并行处理多次才能完全去噪。最好的模型平均每秒生成不到一帧，而且每个用户每分钟的费用可能高达1美元。

这种低效高成本的推理，不得不说是视频生成模型用于实际应用的一大障碍，而这正是Sohu芯片期望解决的问题。

今年6月，Etched宣布已经筹集了1.2亿美元的资金用于扩大生产，并与台积电合作，以35人的精干团队直接放话挑战市值3万亿的英伟达。

AI论文写作一键生成万字原创论文只需5分钟

文章链接: http://youthcy.com/aizixun/3170.html Chat gpt人工智能中文版在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表炎黄立场。

轻创AI智能客户管理系统是一款全面而高效的客户关系管理工具，专门设计用于帮助企业更好地管理他们的客户资源和业务关系。该系统结合了强大的客户关系管理功能与先进的智能化技术，旨在提升客户满意度和忠诚度，从而实现更高的业务效益。

扫码咨询

关注微博

立即咨询

上一篇当AI搜索开始赚钱养家，月暗、智谱和OpenAI上线AI搜索

下一篇孙正义的AI野望：Arm如何成为当下投资热潮的意外赢家？

相关推荐

月之暗面杨植麟：天才少年难躲资本局？

月之暗面杨植麟：天才少年难躲资本局？

　双11当天，这场电商的节日反倒静悄悄，AI领域却爆出了大新闻。大模型独角兽企业『月之暗面』创始人被前司投资人提起仲裁，消息阅读量很快突破10W+。据《暗涌》具 ...

一句话开发AI智能体，有人靠它一单赚10万！80万开发者已入局

一句话开发AI智能体，有人靠它一单赚10万！80万开发者已入局

　最近，AI智能体领域好不热闹。ChatGPT一夜变身AI搜索，为自家AI Agent铺路；Anthropic重磅推出的「计算机使用」，开启了智能体的军备竞赛；谷 ...

字节、快手、Vidu“打野”升级，AI视频小步快跑

字节、快手、Vidu“打野”升级，AI视频小步快跑

　继9月份版本更新之后，光锥智能从生数科技联合创始人兼CEO唐家渝朋友圈获悉，Vidu大模型将于本周再次进行版本升级，Vidu-1.5版本即将上线。此版本更新方向 ...

AI毒液刷屏抖音小红书！闲鱼10元代生成一次，但官网其实免费

AI毒液刷屏抖音小红书！闲鱼10元代生成一次，但官网其实免费

　仅仅2天时间，毒液迅猛攻占了抖音快手小红书！不过不是3分钟看完最新电影，火遍全网的是一款AI驱动的毒液特效：△来自抖音用户西北彭鱼艳甚至还被拿来和美人如云的《甄 ...

京东做外卖，瞄准咖啡奶茶和快餐，互联网巨头都爱“送外卖”？

京东做外卖，瞄准咖啡奶茶和快餐，互联网巨头都爱“送外卖”？

　外卖战场，越来越热闹了！大概一个月前，京东 “秒送” 频道上线了咖啡奶茶与快餐外卖。此后，有关“京东入局外卖”的消息就此起彼伏，按照不少媒体的评价，京东上线外卖 ...

30亿美元的月之暗面，为什么“被仲裁”？

30亿美元的月之暗面，为什么“被仲裁”？

　国内最火的人工智能产品Kimi，背后的创始人被他们上一家公司的部分投资人申请仲裁。听起来有点儿绕，但实际无非就是“人红是非多”罢了。据36氪旗下专注于投资报道的 ...

专注于AI

懂企业管理，更懂CRM系统
0元下载体验

支持免费下载,0元体验
1对1技术支持

专属客户经理提供技术支持
炎黄咨询热线

13728822604

行业解决方案青年创业网新年祝福语

©2023专业国产CRM软件支持私有化支持定制

地址：深圳市龙华区银星科技园 Tel:400 188 1335 网站备案号：粤ICP备08036815号-4Copyright © 2012-2022 轻创AI 版权所有