네이버 디지털 뉴스 아카이브

 

몇 일 전에 네이버에서 또 대박(?)을 터뜨렸다..

이름 하여 네이버 디지털 뉴스 아카이브..

어떻게 보면 간단한 아이디어인데..

비슷한 작업을 작년 구글에서 시작한 것으로 알고있는데..
( http://news.google.com/archivesearch )

네이버도 해낸 것이다..

우선 데이터 량도 어마어마하고,

그 많은 신문들을 모두 스캔하고 전문검색 및 텍스트로 보기도 되는것으로 보아..

신문의 글자까지 DB화 한 것 같다..

여기서 드는 의문은 이미지로 스켄받아서 이미지 프로세싱을 통해서 글자들을 추출했을까 하며 놀랬는데..

아직까지 거기까지는 안되나보다..

약 600명을 동원해서 2년 가까이 작업했다는 것으로 보아,

아마도 수작업으로 하지 않았을까 하는 생각이 든다..

그리고 그 방대한 데이터를 어떻게 구상하고 구현했느냐에 따라 느낌도 천차만별인것같다..

날짜를 검색하는 인터페이스도 그렇고,

신문을 보는 방식도 그렇고,

신문의 기사를 선택해서 보는 방식도 그렇고,

특히 신기했던건,

신문 이미지에 신문기사끼리의 블럭을 잡아준다는 것이다..

과연 이거까지 수작업으로 했을것인가, 아님 이부분은 신문의 패턴분석으로 시스템이 자동으로 잡아주고 있는 것인가?

암튼 좋은 서비스, 양질의 컨텐츠를 이용하게 되서 기쁘다^^

 

This entry was posted in Etc, Scrap and tagged , , , . Bookmark the permalink.

댓글 남기기