블로그에 관심이 많은 A씨. '블로그'라는 단어로 뉴스를 검색하는 일이 많다. 그런데 검색 결과가 별로 만족스럽지 않다. 포털에서 뉴스를 검색하면 '000 기자 블로그'라는 단어가 반복적으로 검색되기 때문이다.
'저작권'이란 단어로 검색해도 마찬가지다. 뉴스 기사 말미에 포함돼 있는 '~에 따른 저작권을 행사합니다'라는 식의 저작권 공지 사항이 포함돼 있기 때문이다.
어쩔 때는 인기 검색어로 떠오르고 있는 단어로 검색을 해보면 기사 안에 포함돼 있는 '관련 기사' 링크가 줄줄이 보이기도 한다. 관련 기사가 없을 때는 '▶' 식의 특수문자가 덩그러니 남아있는 경우도 많다.
심지어 PC통신 시절 때부터 뉴스를 송고하던 일부 신문의 경우 최근까지도 행을 나누기 위해 강제로 삽입한 띄어쓰기나 신문
편집을 위해 임의로 삽입한 띄어쓰기가 그대로 출고되는 상황도 빈번했다. 기사에 삽입된 사진이 중복 노출된다거나 원문과 다른
위치에 삽입돼 있는 장면은 심심치 않게 목격되기도 한다.
기본적으로 뉴스 데이터베이스가 구성될 때 고려되어야 할 사항은 '호환성'이어야 한다. 하지만 신디케이션 산업 구조가
형성되기 전부터 디지털화를 서둘렀던 우리나라의 경우 데이터 호환성보다는 당장의 필요에 의한 마구잡이식 데이터베이스가
만들어져왔다. 결국 현재는 이러한 데이터베이스의 표준화가 정착되기 힘들 정도로 너무 꼬여있는 상태라고 할 수 있다.
초기에 포털로 뉴스를 공급하던 언론사들은 심지어 하루에 여러 차례 텍스트 파일을 이메일로 전송하거나 포털에서 열어준
FTP(파일서버)에 폴더를 만들어 문서 파일을 넣어주기도 했다. 이러다 보면 각 데이터마다 싱크가 일어나지 않아 기사에 문제가
생길 경우 기사 삭제 및 수정 요청이 아날로그 방식인 전화나 이메일을 통하는 경우가 비일비재했다.
'블로그'나 '저작권 공지', '관련 기사' 등의 문제들도 기사가 데이터베이스화 되어 각 필드마다 제각기 기능이 부여되지 않고 본문 안에 모든 요소를 끼워 넣다 보니 생긴 문제들이다.
■ 뉴스 생산에서 유통까지 업계 표준 따라야 상생 가능
최근 뉴스ML에 대한 논의가 언론계쪽에서 활발하게 이뤄지고 있다. 지난 7월에는 문화관광부와 한국언론재단이 한국 뉴스ML포럼과 공동으로 '한국형 뉴스ML 표준안'을 제정 공표한 바 있다.
KNF NewsML Pack V1.0으로 명명된 이 규약은 국제표준기구인 IPTC(국제출판전기 통신회의)의 뉴스ML 1.2
버전을 한국 특성에 맞게 변환한 데이터 형식과 그 해설이 포함돼 있다. 해외에서는 이미 2000년부터 뉴스ML 표준이 정립돼
있었고 일본에서도 비슷한 시기에 XML을 활용한 뉴스ML에 대한 논의가 있었다.
그
러나 안타깝게도 뉴스ML이 실질적인 보급으로 이어지기까지 시간이 필요할 것으로 보인다. 신문업계의 뉴스ML에 대한 이해도가
낮아서라기보다 기존 시스템과의 연동, 또는 기존 데이터를 새로운 뉴스ML 데이터로 변환하는 데 걸리는 시간과 비용이 필요하기
때문이다.
이러한 뉴스ML로의 이전에 장애가 되고 있는 또 다른 이유는 데이터를 받아들여 유통하는 포털들도 표준화된 시스템을 권장하지
않고 있기 때문이기도 하다. 포털마다 같은 뉴스라도 약간씩 정렬이나 보이는 형태가 다른 경우를 심심치 않게 발견할 수 있다.
기사 안에 포함된 링크를 포털이 임의로 제거하는 것도 표준화 문제와 연결된다.
반면 신생 언론사들을 중심으로 XML에 대한 이해도도 높고 표준화된 CMS(콘텐츠 관리 시스템)이 최근 것이어서 뉴스ML에 대응할 수 있는 시스템을 갖춰놓아 뉴스ML로의 이전이 손쉬울 것으로 보인다.
최근 구글이나 네이트 등과 뉴스 신디케이션에 대한 사업 논의를 벌이고 있는 뉴스뱅크사업단 역시 뉴스ML을 표준 포맷으로
채택하고 있다. 그나마 뉴스ML에 대한 사업적 필요성이 부각되고 있다는 점에서 표준으로의 이행 속도가 빨라지고 있다는 점은 역시
다행스러운 일이다.
검색엔진이 가장 좋아하는 문서는 XML 형태의 문서다. 각 필드가 일목요연하게 잘 정리돼 있기 때문이기도 하고, 서로 다른 출처에서 생성된 문서라도 필드를 설명하는 요소들이 표준화되어 있기 때문이다.
RSS(Really Simple Syndication)이란 콘텐츠 구독과 배포 시스템이 정교하게 적용돼 있는 뉴스 사이트도
더 많이 늘어나야 한다. 블로그의 세력이 빠르게 확장할 수 있었던 요인 가운데 하나가 블로그 콘텐츠가 XML 데이터로 변환되어
손쉽게 RSS 시스템을 통해 유통되기 쉬웠기 때문이었다.
뉴스 데이터 형식의 표준화를 서둘러야 할 필요가 여기에 있다. 뉴스 유통 시스템을 표준화하는 것은 뉴스 소비자들은 물론 뉴스 유통 과정의 사업자들과 검색 사업자들 모두 이익이 줄 수 있을 것이다.
생산에서 유통까지 전 과정을 혼자서 독차지하던 미디어 1.0 시대를 지대 생산과 유통 소비의 전 단계가 분산돼 있는
현재로서는 뉴스 생산자들이 좀더 정교한 비즈니스 모델을 수립하는 것도 중요하지만 콘텐츠가 원활하게 흐를 수 있도록 업계 표준을
빠르게 정착시키는 것이 무엇보다 중요하다.
------------------------------------------------------->
이 글은 전자신문인터넷 이버즈에 오늘 날짜로 송고된 칼럼입니다.