전체기사

2025.11.02 (일)

  • 흐림동두천 15.1℃
  • 흐림강릉 15.7℃
  • 흐림서울 16.5℃
  • 흐림대전 19.4℃
  • 흐림대구 19.1℃
  • 흐림울산 19.5℃
  • 흐림광주 22.1℃
  • 흐림부산 21.7℃
  • 구름많음고창 23.2℃
  • 맑음제주 26.3℃
  • 흐림강화 15.4℃
  • 흐림보은 18.0℃
  • 구름많음금산 19.7℃
  • 흐림강진군 23.0℃
  • 흐림경주시 18.6℃
  • 흐림거제 21.8℃
기상청 제공

사회

문체부, '한국어 잘하는 챗GPT' 만든다…약 1억2000만 어절의 한국어 말뭉치 구축

URL복사

[시사뉴스 김미현 기자] 문화체육관광부가 챗GPT로 대표되는 생성형 인공지능(AI) 기술이 가져올 변화에 필요한 문화적·제도적·산업적 기반 마련에 나선다.
 

문체부와 국립국어원은 '한국어를 잘하는 K-챗GPT' 개발을 지원하기 위해 고품질의 한국어 말뭉치 구축을 확대하고 제공할 계획이라고 22일 밝혔다.

 

박보균 장관은 "K-챗GPT의 성공을 앞당기기 위해 대기업은 물론 신생기업까지 저작권 문제와 데이터수집 비용을 걱정하지 않고 풍부한 자료를 학습하게 지원해야 한다"고 전했다.

 

이에 따라 정부는 AI와 말뭉치 구축 전문가, 학계 전문가, 문체부와 국립국어원 연구원 등 3개의 워킹그룹을 발족하고 23일 준비회의를 거쳐 3월부터 8월까지 운영한다. 

 

이들은 인공지능 기술 개발에 필요한 말뭉치 수요를 파악하고 ▲'한국어 잘하는 AI'를 위한 한국어 말뭉치 학습 지원 ▲저작권 제도 개선 ▲콘텐츠 창작과 산업에서의 AI 활용 등의 정책을 마련할 예정이다.

문체부는 올해 한국형 챗GPT가 빠르게 개발될 수 있도록 25종의 약 1억2000만 어절의 한국어 말뭉치를 구축해 배포한다.

 

앞서 2018년부터 구축된 대규모 한국어 말뭉치 37종(약 22억 어절)은 국립국어원 말뭉치 사이트를 통해 오픈소스로 제공돼 한국어 AI 개발에 활용돼 왔다. 이에 정부는 2027년까지 한국어 특성을 반영한 말뭉치 10억 어절을 구축하기로 했다.

 

아울러 AI 언어모델이 한국어를 잘 이해하고 생성하는지, 한국의 사회문화 지식을 갖추고 있는지 검증하는 평가시스템을 시범 운영할 계획이다.

 

AI 기술발전에 따른 저작권 제도 개선 방향도 살펴본다. 저작권 학계와 법조계, AI 산업계와 창작자 등이 참여하는 AI-저작권법 제도개선 워킹그룹을 24일 발족하며, 오는 9월까지 운영한다.

AI 학습데이터에 사용되는 저작물의 원활한 이용 방안, AI 산출물의 법적 지위 문제 및 저작권 제도에서의 인정 여부, AI 기술 활용시 발생하는 저작권 침해와 책임 규정 방안 등을 논의한다.

 

특히 현행 저작권법 내에서 활용될 수 있는 '(가칭)저작권 관점에서의 AI 산출물 활용 가이드(안)'를 마련하는 등 AI 발전을 지원하면서 인간 창작자들의 권리를 공정하게 보장할 수 있도록 다양한 합의점을 모색한다.

콘텐츠 산업 분야에서의 AI 활용에 능동적으로 대응하기 위해 국내 AI 선구자인 김진형 한국과학기술원 명예교수를 비롯해 AI 관련 학계와 업계 관계자 9명으로 '콘텐츠 분야 AI TF'도 구성했다.

AI를 활용한 신뢰 가능한 콘텐츠 제작환경 조성, AI 콘텐츠 스타트업 육성과 대기업 협업 등을 위한 방안을 논의할 예정이다. 챗GPT 등 생성형 AI가 콘텐츠 산업 분야에 미칠 영향과 이슈를 파악하고, 콘텐츠 산업 적용사례를 조사 분석해 정책적 지원 방안을 제안한다.

 

박 장관은 "고품질 한국어 학습데이터인 모두의 말뭉치 구축을 확대하고, AI 산업 발전과 창작자들의 공정한 권리 보장의 균형을 이룰 수 있는 저작권 제도개선 방안을 선제적으로 마련해 나갈 것"이라고 밝혔다.

 

문체부는 TF를 통해 청취한 의견을 종합해 AI를 활용한 콘텐츠산업 분야 지원 대책을 5월까지 마련할 계획이다.

저작권자 Ⓒ시사뉴스
제보가 세상을 바꿉니다.
sisa3228@hanmail.net





커버&이슈

더보기
최대 식품 전시회 '푸드위크 코리아' 성료...식품 트렌드 한눈에
[시사뉴스 홍경의 기자] 농림축산식품부와 코엑스는 지난달 29일부터 11월 1일까지 서울 코엑스 A, B, C홀과 더플라츠에서 '제20회 서울국제식품산업전'( 푸드위크 코리아 2025)를 개최했다. 코엑스를 대표하는 식품 전시회인 ‘서울국제식품산업전'은 국내외 프리미엄 식품부터 대체·신식품, 제조자동화, 스마트유통, 팜테크까지 미래의 식품산업을 선보이는 국내 최대규모 국제 종합 식품 전시회로 올해는 42개국 950개사가 참가했다. '식탁혁명, 푸드테크가 만드는 내일의 식탁'을 주제로 열리는 이번 행사에 참가한 기업들은 AI 영양분석, 대체단백질, 친환경 포장기술 등 첨단 기술과 식생활 트렌드를 선보였다. 전시장은 ▲푸드테크 ▲식품 ▲디저트 ▲외식·급식 등 4개 분야로 구성됐다. 또한, 행사 기간 동안 2026 식품외식산업전망, K-푸드+ 바이어 초청 수출상담회, 푸드테크 기술사업화 성과공유대회, 국가식품클러스터 국제콘퍼런스, 글로벌 푸드테크 기술 표준화 심포지엄 등 다양한 부대 행사가 함께 열렸다. 개막식에서는 송미령 농림축산식품부 장관이 식품외식산업 발전 유공자에게 은탑산업훈장을 비롯한 11점의 정부포상을 직접 수여했다. 송 장관은 이날 개막식 격려사를 통

정치

더보기

경제

더보기
최대 식품 전시회 '푸드위크 코리아' 성료...식품 트렌드 한눈에
[시사뉴스 홍경의 기자] 농림축산식품부와 코엑스는 지난달 29일부터 11월 1일까지 서울 코엑스 A, B, C홀과 더플라츠에서 '제20회 서울국제식품산업전'( 푸드위크 코리아 2025)를 개최했다. 코엑스를 대표하는 식품 전시회인 ‘서울국제식품산업전'은 국내외 프리미엄 식품부터 대체·신식품, 제조자동화, 스마트유통, 팜테크까지 미래의 식품산업을 선보이는 국내 최대규모 국제 종합 식품 전시회로 올해는 42개국 950개사가 참가했다. '식탁혁명, 푸드테크가 만드는 내일의 식탁'을 주제로 열리는 이번 행사에 참가한 기업들은 AI 영양분석, 대체단백질, 친환경 포장기술 등 첨단 기술과 식생활 트렌드를 선보였다. 전시장은 ▲푸드테크 ▲식품 ▲디저트 ▲외식·급식 등 4개 분야로 구성됐다. 또한, 행사 기간 동안 2026 식품외식산업전망, K-푸드+ 바이어 초청 수출상담회, 푸드테크 기술사업화 성과공유대회, 국가식품클러스터 국제콘퍼런스, 글로벌 푸드테크 기술 표준화 심포지엄 등 다양한 부대 행사가 함께 열렸다. 개막식에서는 송미령 농림축산식품부 장관이 식품외식산업 발전 유공자에게 은탑산업훈장을 비롯한 11점의 정부포상을 직접 수여했다. 송 장관은 이날 개막식 격려사를 통

사회

더보기

문화

더보기

오피니언

더보기
【박성태 칼럼】 스포트라이트 받는 주인공 뒤에 숨은 조력자를 기억하자
지난 14일 서울 월드컵경기장에서 열린 한국과 파라과이의 축구 평가전에서 스포트라이트를 받은 선수는 단연 오현규였다. 그는 후반 30분 승리에 쐐기를 박는 결정적인 골을 넣으며 언론의 헤드라인을 장식했다. 그러나 그 골의 배후에는 수비수 두 명을 제치는 현란한 드리블 후 냉정히 경기의 흐름을 읽고 찬스를 만들어낸 또 다른 주인공이 있었다. 바로 이강인이다. 그는 전방으로 빠르게 침투한 오현규에게 정확한 타이밍의 패스를 연결해 골의 90%를 만들어 내었다고 해도 과언이 아니다. 그러나 경기가 끝난 후 조명은 오직 골을 넣은 선수에게만 쏟아졌고, 이강인의 이름은 짤막이 언급되었다. 지난 21일 한국프로야구 2025 플레이오프 한화 대 삼성의 3차전에서 한화가 5대4로 역전승을 거둔 뒤, 단연 승리의 주역으로 스포트라이트를 받은 선수는 구원투수로 나와 4이닝 무실점으로 역투한 문동주였다. 그런데 사실 한화가 역전승을 할 수 있었던 것은 상대적으로 어린 문동주를 노련한 투수 리드로 이끌어간 최재훈 포수가 있었기 때문이다. 경기가 끝난 후 역투한 문동주와 역전 투런 홈런을 친 노시환만 승리의 주역으로 스포트라이트를 받았고 최재훈의 이름은 언급조차 없다. 이러한 장면은


배너