自動駕駛

# 自動駕駛

GAIA-2

GAIA-2 是 Wayve 開發的先進視頻生成模型，旨在為自動駕駛系統提供多樣化和複雜的駕駛場景，以提高安全性和可靠性。該模型通過生成合成數據來解決依賴現實世界數據收集的限制，能夠創建各種駕駛情境，包括常規和邊緣案例。GAIA-2 支持多種地理和環境條件的模擬，幫助開發者在沒有高昂成本的情況下快速測試和驗證自動駕駛算法。

NVIDIA Cosmos

NVIDIA Cosmos是一個先進的世界基礎模型平臺，旨在加速物理AI系統的開發，如自動駕駛車輛和機器人。它提供了一系列預訓練的生成模型、高級分詞器和加速數據處理管道，使開發者能夠更容易地構建和優化物理AI應用。Cosmos通過其開放的模型許可，降低了開發成本，提高了開發效率，適用於各種規模的企業和研究機構。

模型訓練與部署

OpenEMMA

OpenEMMA是一個開源項目，復現了Waymo的EMMA模型，提供了一個端到端框架用於自動駕駛車輛的運動規劃。該模型利用預訓練的視覺語言模型（VLMs）如GPT-4和LLaVA，整合文本和前視攝像頭輸入，實現對未來自身路徑點的精確預測，並提供決策理由。OpenEMMA的目標是為研究人員和開發者提供易於獲取的工具，以推進自動駕駛研究和應用。

模型訓練與部署

智趣AI甄選

智趣AI甄選是一個專注於人工智能領域的綜合性平臺，旨在洞察行業發展前景，精選並展示國內外的AI產品與應用。平臺提供豐富的學習資源，行業融合案例分析，助力用戶洞悉AI發展趨勢，與AI技術同行，共創未來。

DiffusionDrive

DiffusionDrive是一個用於即時端到端自動駕駛的截斷擴散模型，它通過減少擴散去噪步驟來加快計算速度，同時保持高準確性和多樣性。該模型直接從人類示範中學習，無需複雜的預處理或後處理步驟，即可實現即時的自動駕駛決策。DiffusionDrive在NAVSIM基準測試中取得了88.1 PDMS的突破性成績，並且能夠在45 FPS的速度下運行。

We, Robot

We, Robot 是特斯拉公司展示其在自動駕駛技術和機器人技術領域願景的頁面。它強調了特斯拉對於創建可持續未來、提高交通效率、可負擔性和安全性的承諾。該頁面介紹了特斯拉的全自動駕駛技術（監督）以及未來自動駕駛汽車和機器人的潛在應用，如Robotaxi、Robovan和Tesla Bot。這些技術旨在通過自動化提高日常生活的便利性，同時減少交通事故，降低交通成本。

Depth Pro

Depth Pro是一個用於單目深度估計的研究項目，它能夠快速生成高精度的深度圖。該模型利用多尺度視覺變換器進行密集預測，並結合真實與合成數據集進行訓練，以實現高準確度和細節捕捉。它在標準GPU上生成2.25百萬像素深度圖僅需0.3秒，具有速度快、精度高的特點，對於機器視覺和增強現實等領域具有重要意義。

OmniRe

OmniRe 是一種用於高效重建高保真動態城市場景的全面方法，它通過設備日誌來實現。該技術通過構建基於高斯表示的動態神經場景圖，以及構建多個局部規範空間來模擬包括車輛、行人和騎行者在內的各種動態行為者，從而實現了對場景中不同對象的全面重建。OmniRe 允許我們全面重建場景中存在的不同對象，並隨後實現所有參與者即時參與的重建場景的模擬。在 Waymo 數據集上的廣泛評估表明，OmniRe 在定量和定性方面都大幅超越了先前的最先進方法。

Boden Annotation Service Enhancement (BASE)

Boden Annotation Service Enhancement (BASE)

博登智能自主研發的數據標註處理平臺——BASE（Boden Annotation Service Enhancement），具有超強適用性，可完成從數據採集、清洗、標註到驗證的全套服務。BASE平臺覆蓋了包括語音、文本、圖像、視頻、點雲等多種模態類型的數據處理能力，通過AI輔助標註的形式，相較於傳統的標註方式，幫助企業節省了高達30%-40%的成本，並提升50%以上的效率，已經獲得了市場的廣泛認可。數據處理平臺——BASE平臺能夠支持開展包括通用圖像標註，3D/4D點雲標註，圖片點雲融合標註，NLP文本標註，醫療影像標註，視頻描述標註，音素標註，音頻標註等標註業務。

Silo AI

Silo AI 是歐洲最大的私人人工智能實驗室，與行業領導者合作開發智能設備、自動駕駛車輛、工業4.0和智能城市。其產品和技術致力於將最先進的人工智能帶入生產，為客戶帶來利益。

DriveVLM

DriveVLM是一個自動駕駛系統，它利用視覺語言模型(VLMs)來增強場景理解和規劃能力。該系統通過獨特的推理模塊組合，包括場景描述、場景分析和分層規劃，以提高對複雜和長尾場景的理解。此外，為了解決VLMs在空間推理和計算需求上的侷限性，提出了DriveVLM-Dual，這是一個混合系統，結合了DriveVLM的優勢和傳統自動駕駛流程。在nuScenes數據集和SUP-AD數據集上的實驗表明，DriveVLM和DriveVLM-Dual在處理複雜和不可預測的駕駛條件方面非常有效。最終，DriveVLM-Dual在生產車輛上進行了部署，驗證了其在現實世界自動駕駛環境中的有效性。

GenAD

GenAD是由上海人工智能實驗室聯合香港科技大學、德國圖賓根大學和香港大學共同推出的首個大規模自動駕駛視頻生成模型。它通過預測和模擬真實世界場景,為自動駕駛技術的研究和應用提供支撐。GenAD在理解複雜動態環境、適應開放世界場景、精準預測等方面具有較強能力,能夠通過語言和行車軌跡進行控制,並展現出應用於自動駕駛規劃任務的潛力,有助於提高行車安全性和效率。

GAIA-1

GAIA-1是一種具有90億參數的通用式生成世界模型,專為自動駕駛而設計。它可以通過視頻、文本和動作輸入生成逼真的駕駛場景視頻,並可以精細控制自己車輛的行為以及場景中的特徵。GAIA-1利用多模態學習方法,可以生成豐富多樣的駕駛場景,增強自動駕駛系統的學習和解釋能力。它的關鍵功能包括:基於視頻、文本和動作的生成能力、可控性高、支持長時間生成、可擴展等。GAIA-1可用於自動駕駛研究、仿真、數據增強等多種應用場景。它代表了生成式AI在自動駕駛領域的先進探索,為創新提供了無限可能。

Blog Booster

BLOGBOOSTER.ai是一款專為WordPress網站設計的AI自動駕駛工具。它可以生成適用於您的博客的主題，並每月自動寫作和發佈文章。通過定期添加內容，提升您的網站的SEO效果，吸引更多的流量和銷售。價格靈活，可根據每月所需的文章數量選擇計劃。

精選AI產品推薦

騰訊混元圖像 2.0

騰訊混元圖像 2.0

騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型，顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構，使得圖像生成速度可達到毫秒級，避免了傳統生成的等待時間。同時，模型通過強化學習算法與人類美學知識的結合，提升了圖像的真實感和細節表現，適合設計師、創作者等專業用戶使用。

Lovart

Lovart 是一款革命性的 AI 設計代理，能夠將創意提示轉化為藝術作品，支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程，節省時間並提升創意靈感。Lovart 當前處於測試階段，用戶可加入等候名單，隨時體驗設計的樂趣。

FastVLM

FastVLM 是一種高效的視覺編碼模型，專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器，減少了高分辨率圖像的編碼時間和輸出的 token 數量，使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力，適用於各種應用場景，尤其在需要快速響應的移動設備上表現優異。

KeySync

KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題，同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果，適用於自動配音等實際應用場景。

Manus

Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品，能夠直接交付完整的任務成果，而不僅僅是提供建議或答案。它採用 Multiple Agent 架構，運行在獨立虛擬機中，能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現，展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’，幫助用戶高效完成各種複雜任務。

Trae國內版

Trae是一款專為中文開發場景設計的AI原生IDE，將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能，顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白，滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具，旨在為專業開發者提供強大的技術支持，目前尚未明確公開價格，但預計會採用付費模式以匹配其高端定位。

開發與工具

Pika

Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。

LiblibAI

LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase