報告人
王井東
百度計算機視覺首席科學家
報告信息
報告時間:
2023年6月5日 15:00 - 16:00
報告地址:
燕園校區:理科二号樓2736
昌平校區:102教室
主持人
林宙辰 教授
beat365beat365、人工智能研究院
Abstract
本報告主要内容包括百度文心·CV大模型VIMER以數據為中心的算法和應用。首先,介紹自監督表征學習算法Context Autoencoder(CAE)算法及其推廣。然後,講述基于CAE的工業視覺大模型、OCR文字識别大模型、人體大模型等。最後分享圖文對比預訓練大模型在自動駕駛數據挖掘中的應用和基于多任務學習的交通感知大模型。
Biography
王井東,百度計算機視覺首席科學家,負責計算機視覺領域的研究、技術創新和産品研發。加入百度之前,曾任微軟亞洲研究院視覺計算組首席研究員。2001年和2004年在清華大學獲得學士和碩士學位,2007年在香港科技大學獲得博士學位。研究領域為計算機視覺、深度學習及多媒體搜索。他的代表工作包括高分辨率神經網絡、基于transformer attention的圖像語義分割網絡OCRNet、以及基于近鄰圖的大規模最近鄰搜索等。在微軟工作期間,科研成果10多次轉化到微軟的關鍵産品和業務中去,包括搜索、廣告、OCR、小冰聊天機器人等。在百度帶領團隊研發的技術已經廣泛應用于百度的搜索、智能雲以及自動駕駛等重要産品和業務中。
他曾擔任過許多人工智能會議的領域主席,如 NerIPS、CVPR、ICCV、ECCV、AAAI、IJCAI、ACM MM等。他現在是IEEE TPAMI和IJCV的編委會成員,曾是IEEE TMM和IEEE TCSVT編委會成員。因在視覺内容理解和檢索領域的傑出貢獻,他被遴選為國際電氣電子工程師學會和國際模式識别學會會士、國際計算機協會傑出會員。
地址:北京市海澱區頤和園路5号(62755617) 反饋意見:its@pku.edu.cn
Copyright 版權所有©beat·365(中国)唯一官方网站 All Rrights Reserved.