百度文庫昨日宣布,文庫對非授權文學類作品的清理工作已基本完成,此前“三日內清空”的承諾兌現。
“人拉肩扛”審侵權
自百度文庫糾紛爆發以來,先后經歷了作家“3·15”發公開信、雙方代表談判、百度聲明“三日內清空”等階段。昨天,是百度發出“清理文庫非授權文學類作品”聲明的第三天。記者昨日下午登錄百度文庫,發現文庫文學分類下的文檔數減至不到150份。在文庫糾紛前,這一數字為270多萬份。
百度副總裁朱光昨日接受本報記者采訪時表示,3月26日開始,百度調集公司各部門的技術力量,加速對文庫中可能侵犯他人著作權的文檔進行清理。即日起,百度文庫用戶如果上傳一千字以上的文檔,將由百度員工人工審核內容,確定沒有侵權內容后才予以放行。“現在我們是人拉肩扛,全員上陣,但這種情況不可能持續?!敝旃夥Q。
昨日,記者使用自己的文庫賬號上傳一小說的電子文本,文庫提示“該文檔無法上傳”。但是,在文庫的非文學分類中,記者仍然看到了一些版權書的電子版。
對此,朱光表示,文庫文學分類是版權糾紛的“重災區”,因此百度現在集中精力先清理文學類的侵權作品。對于非文學類文檔,也在采用人工審核的方式清理。他呼吁,如果在文庫中發現侵權文檔,可通過文庫首頁的投訴通道直接投訴。
版權DNA比對系統五一后運行
朱光昨日透露,人工審核方式將持續到4月中旬?!?月11日之后,版權DNA比對系統將開始內測,五一之后正式運行。此后,百度文庫將依靠這一系統維護版權方的權益?!敝旃夥Q。
據悉,版權DNA比對系統是百度在文庫正式上線前研發的技術,通過對文檔內容分析后提取的特征點進行判別,如發現侵權文檔,則阻止上傳。朱光表示,版權方可將作品電子文檔提供給百度供提取特征點使用,百度也會自行采購一些熱銷、常見的文學作品制作特征點,以避免在沒有版權方配合的情況下發生侵權。
百度文庫相關負責人表示,全面清除侵權類作品后,下一步工作重點將放在加大與出版社及版權方的合作方面。百度將積極探索,通過用戶付費、網絡廣告等方式,幫助版權方獲益,同時將大部分利益回饋給版權方。