Transformer

加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

TRANSFORMER,作詞:Kenzie(韓文),T-Crash(中文),作曲: Kenzie / Jonathan Yip /Jonathan Yip / Ray Romulus / Ray McCullough,演唱:EXO。

TRANSFORMER,作詞:Kenzie(韓文),T-Crash(中文),作曲: Kenzie / Jonathan Yip /Jonathan Yip / Ray Romulus / Ray McCullough,演唱:EXO。收起

查看更多
  • 自動駕駛中一直說的BEV+Transformer到底是個啥?
    在很多車企的自動駕駛介紹中,都會聽到一個關(guān)鍵技術(shù),那就是BEV+Transformer,那BEV+Transformer到底是個啥?為什么很多車企在自動駕駛技術(shù)中都十分追捧這項技術(shù)?其實“BEV(Bird’s Eye View)+Transformer”是兩個方向的技術(shù),BEV是一種全新的3D坐標(biāo)系,而Transformer則是一種深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型,BEV+Transformer的組合方案在感知、理解和預(yù)測方面表現(xiàn)得更為強(qiáng)大,徹底終結(jié)了2D直視圖+CNN時代。
    自動駕駛中一直說的BEV+Transformer到底是個啥?
  • EdgeNAT: 高效邊緣檢測的 Transformer
    邊緣檢測是許多計算機(jī)視覺任務(wù)的基礎(chǔ),旨在從輸入圖像中精確提取物體邊界和視覺顯著的邊緣。然而,由于圖像中存在遠(yuǎn)距離物體、復(fù)雜背景中的模糊邊界以及物體內(nèi)部的顏色變化等挑戰(zhàn),邊緣檢測任務(wù)變得十分困難。傳統(tǒng)的邊緣檢測方法主要依賴于顏色和紋理等局部信息,而基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的深度學(xué)習(xí)方法雖然可以擴(kuò)展感受野以捕捉全局特征,但容易丟失細(xì)節(jié)信息。
  • 智駕行業(yè)BEV+Transformer到端到端“追熱詞”為奪技術(shù)終局優(yōu)勢?
    自去年以來,業(yè)界不斷討論和提及“BEV+Transformer”這一概念,即鳥瞰視圖與基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu)。卷了半年時間,今年,“端到端”這一概念又迅速成為人們熱議的焦點。這兩個概念看似截然不同,實則在視覺路線建立的基于Transformer 的架構(gòu)上有著共通之處,也共同印證了人工智能技術(shù)從深度學(xué)習(xí)向多模態(tài)大模型演進(jìn)的趨勢。汽車領(lǐng)域始終處于自動駕駛技術(shù)革新的前沿。
    智駕行業(yè)BEV+Transformer到端到端“追熱詞”為奪技術(shù)終局優(yōu)勢?
  • RefMask3D: 基于語言引導(dǎo)的3D指代分割Transformer
    論文 RefMask3D: Language-Guided Transformer for 3D Referring Segmentation 提出了一種新的方法來解決3D點云中的目標(biāo)識別和分割問題,特別是基于語言描述的目標(biāo)識別。
  • AI的未來發(fā)展:分治法在左,端到端在右
    陽萌或許是我接觸過的最懂技術(shù)的CEO:他是北大計算機(jī)本科,碩博連讀機(jī)器學(xué)習(xí)專業(yè),但博士讀了一半就跑了;他是百億營收大廠安克創(chuàng)新的創(chuàng)始人,也曾在谷歌做搜索算法的研發(fā);他的公司主要做的是充電寶、掃地機(jī)器人這些消費(fèi)類電子產(chǎn)品,但我們聊的是人工智能、芯片等等硬科技。
    3473
    2024/05/17
    AI的未來發(fā)展:分治法在左,端到端在右
  • 三大角度解讀地平線征程6芯片——全面升維,加速智駕全場景落地
    地平線立足于推動智能駕駛?cè)珗鼍敖鉀Q方案的落地,其一系列最新突破和進(jìn)展,也讓業(yè)界看到了它在智駕領(lǐng)域的巨大潛力。未來,隨著智駕數(shù)據(jù)量的積累、視覺大模型及多模態(tài)大模型技術(shù)框架與效果的提升,智能駕駛的能力有望達(dá)到新的高度。而地平線在全棧開發(fā)方面的積累和產(chǎn)業(yè)鏈影響力,都有助于它擁抱行業(yè)未來的高速發(fā)展。
  • AI 2024:回望哇聲一片,前瞻道阻且長
    在Transformer大模型熱戰(zhàn)于云端之際,業(yè)界已經(jīng)看到了它在端側(cè)、邊緣側(cè)的市場機(jī)會。如何使Transformer在硬件設(shè)備尤其是端側(cè)和邊緣側(cè)硬件高效運(yùn)行,將成為硬件廠商未來的重點方向。
    AI 2024:回望哇聲一片,前瞻道阻且長
  • 大模型是不是有點太多了?
    上個月,AI業(yè)界爆發(fā)了一場“動物戰(zhàn)爭”。一方是Meta推出的Llama(美洲駝),由于其開源的特性,歷來深受開發(fā)者社區(qū)的歡迎。NEC(日本電氣)在仔細(xì)鉆研了Llama論文和源代碼后,迅速“自主研發(fā)”出了日語版ChatGPT,幫日本解決了AI卡脖子難題。另一方則是一個名為Falcon(獵鷹)的大模型。今年5月,F(xiàn)alcon-40B問世,力壓美洲駝登頂了“開源LLM(大語言模型)排行榜”。
  • Transformer流行的背后
    許多技術(shù)公司都在大肆宣揚(yáng)自己擁有比其他公司更好的處理transformer算法的解決方案。但其實業(yè)界transformer的基準(zhǔn)測試尚未推出。Generative AI(GAI)的蓬勃發(fā)展已經(jīng)顛覆了整個AI世界,似乎是這樣。大語言模型(LLM),如ChatGPT所示,大多局限于語言建模和文本生成。但transformer(一種支撐LLM和其他GAI應(yīng)用的總體深度學(xué)習(xí)架構(gòu))提供了一種可用于文本、語音、圖像、3D和視頻等數(shù)據(jù)流或任何傳感數(shù)據(jù)的模型。
    Transformer流行的背后
  • 高能低耗易部署,愛芯元智AX650N成Transformer最佳落地平臺
    近來,ChatGPT成為社會各界關(guān)注的焦點。從技術(shù)領(lǐng)域看,ChatGPT的爆發(fā)是深度學(xué)習(xí)領(lǐng)域演進(jìn)、發(fā)展和突破的結(jié)果,其背后代表著Transformer結(jié)構(gòu)下的大模型技術(shù)的飛速進(jìn)展。因此,如何在端側(cè)、邊緣側(cè)高效部署Transformer也成為用戶選擇平臺的核心考量。
    高能低耗易部署,愛芯元智AX650N成Transformer最佳落地平臺
  • 一文看懂BEVFormer技術(shù)及其背后價值
    近期,理想、蔚來、小鵬、小馬智行、百度等多家主流車企、自動駕駛方案解決商推出相關(guān)量產(chǎn)方案。一時間,BEV越發(fā)“火”了起來。
    一文看懂BEVFormer技術(shù)及其背后價值
  • 存算一體視覺SoC 破解端側(cè)Transformer處理難題
    目前,AI模型的主干網(wǎng)絡(luò)正從CNN轉(zhuǎn)變?yōu)門ransformer,因為后者具有精度高、全局性特征、多模態(tài)和遷移性強(qiáng)的特點。在云端,用Transformer已經(jīng)可以實現(xiàn)虛擬教師、AI智能對話(例如ChatGPT),代碼自動生成等場景,可以用GPU加速計算Transformer,但在端側(cè)——如機(jī)器人、智慧教育等場景——目前的處理器在Transformer的加速計算上還面臨難題。
    存算一體視覺SoC 破解端側(cè)Transformer處理難題
  • ?Transformer+CNN,引領(lǐng)新一代AI發(fā)展
    視覺應(yīng)用作為人工智能最普及的基礎(chǔ)設(shè)施層,重要性卻不言而喻。它可以說是人工智能機(jī)器的‘眼睛’,賦予它感知的能力,使它能夠‘看懂’這個世界。而計算機(jī)視覺中的深度神經(jīng)網(wǎng)絡(luò)(DNN)架構(gòu)則是這雙眼睛的‘視網(wǎng)膜’,賦予了它可視的源泉。
  • 如何實現(xiàn)“輕高精地圖”的城市NOH?毫末自動駕駛的8大亮點
    4月19日,毫末的AI DAY,在這次發(fā)布會的前后一周,毫末技術(shù)總監(jiān)潘興也有一次與媒體的溝通,并在分享結(jié)束后接受了媒體群訪,從演講到訪談同樣是干貨滿滿。

正在努力加載...