Li Auto разкрива модела MindVLA-o1 от следващо поколение за автономно шофиране

Li Auto представи своя основен модел за автономно шофиране от следващо поколение, MindVLA-o1, на NVIDIA GTC 2026 на 17 март.

Представен от лидера на модела на основата на компанията Zhan Kun, MindVLA-o1 е проектиран като унифициран модел на визия-език-действие (VLA) за интелигентност в реалния свят, интегриращ пет основни технологични иновации: 3D пространствено разбиране, мултимодално разсъждение, генериране на унифицирани действия, затворен цикъл на обучение за подсилване и съвместен дизайн на хардуер и софтуер.

MindVLA-o1.avif

Моделът бележи преминаване към системи за автономно шофиране, управлявани от логика. За разлика от традиционните подходи, изискващи голямо възприятие, MindVLA-o1 комбинира входове от камера и LiDAR чрез 3D енкодер, позволявайки на превозните средства да възприемат дълбочина, разстояние и движение по начин, по-близък до човешкото пространствено разбиране.

Той също така въвежда „модел на латентен свят“, способен да симулира сценарии от близко бъдеще, позволявайки на системата да предвижда промени и да взема по-далновидни решения. От страна на изпълнението, VLA-MoE (смес от експерти) архитектура позволява на модела да генерира пълни траектории на шофиране паралелно, усъвършенствани чрез процес на оптимизация, подобен на обезшумяване, за по-гладко и по-физически последователно движение.

За да ускори обучението, Li Auto изгради широкомащабна симулационна среда, позволяваща на модела да се обучава не само върху данни от реалния свят, но и чрез високоефективни виртуални сценарии, което значително намалява разходите за обучение. Междувременно оптимизацията на софтуера и хардуера позволява на модела да работи по-ефективно на чипове в превозното средство, намалявайки циклите на проектиране на архитектурата от месеци на дни.

MindVLA-o1 отразява по-широкия стремеж на Li Auto към интегриране на широкомащабни AI модели в автономно шофиране, тъй като индустрията все повече преминава от системи, базирани на правила, към архитектури, управлявани от основен модел.

Източник: IT Home

Source link

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin