跨媒體智能将多媒體計算與人工智能結合,開展文字、圖像、視頻、音頻、文檔、3D等多媒體内容理解與生成的理論、方法和技術研究,主要目的是借鑒人腦的跨媒體特性,跨越視覺、語言、聽覺等不同感官信息感知和認知外部世界,實現多媒體信息的智能處理。
主要研究内容包括多媒體壓縮與處理、多媒體分析、跨媒體檢索、跨媒體生成、跨媒體傳輸、跨媒體知識圖譜、文檔智能、文字計算等。多媒體智能技術廣泛應用于新聞出版、新媒體、互聯網、各企事業單位等領域,應用技術包括圖像視頻等内容的生成(AIGC)、圖像細分類、特定内容檢測與識别、大規模跨媒體内容檢索、文檔信息識别與分析、多模态信息融合處理等等。
地址:北京市海澱區頤和園路5号(62755617) 反饋意見:its@pku.edu.cn
Copyright 版權所有©beat·365(中国)唯一官方网站 All Rrights Reserved.