위키백과, AI 번역과 정확도 문제 발생 원인과 대안에 대해
최근 기술 미디어 PCWorld 는 위키백과의 운영을 담당하는 비영리 조직인 오픈노Knowledge 협회 (OKA) 와 대형 언어 모델 (LLM) 이 공유하는 번역 시스템 간에 발생하는 신뢰성 문제를 집중적으로 보도했습니다. 이 기사는 우리가 잘 알고 있는 위키백과조차도 AI 번역 도구에 의존하면서 심각한 오류가 발생할 수 있음을 경고하고 있으며, 특히 기술적 허점과 윤리적 고려사항이 복잡하게 얽혀 있는 사례입니다. 핵심 문제는 AI 가 정보를 생성하거나 번역하는 과정에서 사실과 다른 내용을 만들어내는 ‘환각 (Hallucination)’ 현상 때문입니다. 이는 AI 가 인간처럼 생각하지 않고 학습된 데이터 패턴을 바탕으로 거짓을 만들어내는 문제를 의미하며, 위키백과처럼 정확성이 생명인 지식 위키에서는 치명적인 오류로 이어질 수 있습니다.
기사에서 다루는 주요 배경은 위키백과가 전 세계에서 다양한 언어로 콘텐츠를 제공해야 하지만, 각 언어버전에 인력이 부족한 상황입니다. 이로 인해 오픈노Knowledge 협회는 월 약 400 달러에 해당되는 급여를 지불하며, 전 세계 많은 번역가를 고용하여 주요 언어의 위키백과를 번역해 나가고자 했습니다. 이전에는 일론 머스크가 개발한 Grok 모델을 사용했으나, 부적절한 콘텐츠가 생성되거나 문제 사례가 발생하자 구글 지미나 ChatGPT 와 같은 다른 LLM 로 변경하여 작업을 진행했습니다. 하지만 이러한 변화에도 불구하고 AI 가 기본 정보뿐만 아니라 문서 인용 등 중요한 부분에서도 실수를 저지르고 있다는 사실은 여전히 존재합니다.
위키백과 편집자들은 대부분 무보수로 직접 참여하지만, OKA 번역가들은 급여를 받습니다. 이로 인해 작업 속도가 빨라지며, 이 과정에서 오류가 발생할 경우 엄격하게 처벌받습니다. 특히 다섯 번의 문서를 확인하여 오류가 발견되면 해당 번역가가 퇴출될 수 있으며, 이전에 생산된 번역본도 삭제될 경우입니다. 이는 기술적 효율성을 우선시하는 과정에서 인간의 검수를 간과할 수 있는 위험성 때문에 나온 조치로, 오히려 신뢰성을 떨어뜨릴 수 있다는 우려를 낳았습니다. 또한, 번역 작업은 단순한 텍스트 변환이 아닌 문맥과 의도를 파악하는 과정인데, AI 는 이를 완벽하게 처리하지 못합니다.
영어 위키백과를 기준으로 한다면, 가장 큰 영어판을 제외하고 다른 언어나 언어판은 상대적으로 정보가 적고 빈약한 것이 사실입니다. 이에 따라 AI 번역을 적극적으로 도입하여 정보를 확장하려는 시도는 옳은 방향일 수 있으나, 정보의 신뢰성을 훼손한다면 그 의미가 퇴색될 수 있습니다. 예를 들어, 책 페이지의 인용문헌이 엉뚱한 내용을 가르거나, 전혀 관련 없는 책의 페이지를 인용할 경우 독자들은 혼란을 겪게 됩니다. 이는 법률 문서 작업 등 정밀한 작업을 처리하는 AI 의 한계를 보여준 사례라 할 수 있습니다. 따라서 우리는 이러한 기술의 발전 속도가 인간의 판단력을 대체할 수 있다는 착각을 경각심을 가지고 대응해야 합니다.
결론적으로, 이 보도는 우리가 AI 기술을 맹목적으로 믿는 태도를 되돌아보게 만듭니다. AI 가 제공하는 정보는 빠르지만 오류가 포함될 수 있으므로, 우리는 항상 출처와 내용을 다시 확인해야 합니다. 특히 위키백과처럼 누구나 편집 가능한 플랫폼에서는 AI 가 만든 내용을 그대로 믿지 않고, 인간 전문가가 검증한 내용을 우선시해야 합니다. PCWorld 의 기고 작가인 마이클 크라이더 는 15 년 동안 기술 전문 저널리스트로 활동하며, 애플과 다양한 기업들을 취재하여 왔습니다. 그의 이번 기사는 AI 가 기술적으로 발전하고 있으나, 여전히 인간이 검증해야 할 부분이 많음을 보여주는 사례로, 우리는 이를 수용하면서 그 한계를 인지해야 합니다.
마지막으로, 글로벌 남반부에 거주하는 번역가들은 제한된 예산으로 활동하며, 이는 인권 및 윤리적 문제를 함께 고려해야 하는 부분입니다. 급여가 적지만, 그 지역에 사는 그들이 위키백과에 기여할 수 있다는 것은 의미 있지만, 동시에 실수 시 즉각적인 제재를 받는 것은 불공정할 소지가 있습니다. 따라서 이러한 시스템의 균형이 맞아야 하며, 기술 발전과 인간 가치 사이에서 적절한 조화가 필요하다는 메시지를 전달합니다. 위키백과뿐만 아니라 인터넷 전체에서 AI 가 생산하는 정보의 진위 여부를 판단하는 능력은 디지털 시대를 사는 우리에게 더욱 중요한 역량이 될 것입니다. 앞으로는 AI 번역을 활용할 때도 인간 검수와 투명한 검증 시스템을 반드시 병행해야 하며, 기술 혁신과 정보 정확성 사이에서 균형을 찾는 노력이 계속되어야 합니다. 결국 우리가 매일 접속하는 지식 위키조차도 AI 번역 문제로 인해 정확성을 잃지 않도록 하는 것, 그것이 기술 발전을 위한 진정한 책임이라고 할 수 있습니다.
이 글은 PCWorld의 기사를 바탕으로 작성되었습니다.
