本期為TechBeat人工智能社區(qū)第529期線上Talk!北京時間9月7日(周四)20:00, 清華大學(xué)博士生—諸子鈺的Talk將準(zhǔn)時在TechBeat人工智能社區(qū)開播!他與大家分享的主題是: “3D-VisTA通用統(tǒng)一的3D視覺語言預(yù)訓(xùn)練模型”,屆時將聚焦于3D視覺語言領(lǐng)域,介紹3D視覺語言的相關(guān)任務(wù),以及他們團(tuán)隊(duì)的最新工作3D-VisTA是如何設(shè)計(jì)通用統(tǒng)一的視覺語言模型的。主題:3D-VisTA通用統(tǒng)一的3D視覺語言預(yù)訓(xùn)練模型地點(diǎn):TechBeat人工智能社區(qū)
在大語言模型時代,對齊3D的物理世界和自然語言是實(shí)現(xiàn)通用具身智能十分重要的一步。本次講座我們聚焦于3D視覺語言領(lǐng)域,介紹3D視覺語言的相關(guān)任務(wù),以及我們的最新工作3D-VisTA是如何設(shè)計(jì)通用統(tǒng)一的視覺語言模型,用簡潔的方式來解決這些任務(wù)的。
Talk大綱
1. 3D視覺語言領(lǐng)域介紹和相關(guān)任務(wù)。2. 通用模型和任務(wù)特定模型的區(qū)別。3. 3D-VisTA在通用3D視覺語言學(xué)習(xí)的探索。Talk·預(yù)習(xí)資料

論文鏈接:
https://arxiv.org/pdf/2308.04352.pdf

論文鏈接:
https://arxiv.org/pdf/2108.07258.pdf
項(xiàng)目代碼:
https://language3dscenes.github.io
Talk·提問交流
在Talk界面下的【交流區(qū)】參與互動!留下你的打call