전체기사

2025.10.23 (목)

  • 흐림동두천 15.1℃
  • 흐림강릉 15.7℃
  • 흐림서울 16.5℃
  • 흐림대전 19.4℃
  • 흐림대구 19.1℃
  • 흐림울산 19.5℃
  • 흐림광주 22.1℃
  • 흐림부산 21.7℃
  • 구름많음고창 23.2℃
  • 맑음제주 26.3℃
  • 흐림강화 15.4℃
  • 흐림보은 18.0℃
  • 구름많음금산 19.7℃
  • 흐림강진군 23.0℃
  • 흐림경주시 18.6℃
  • 흐림거제 21.8℃
기상청 제공

e-biz

셀렉트스타, 1억 3천만건 AI 학습데이터 구축 프로젝트 분석 결과 발표

URL복사

한국어 데이터셋 진화 중, 초개인화 추천 연구개발 활발

 

[시사뉴스 김남규 기자] 셀렉트스타가 인공지능(AI) 학습데이터 구축 트렌드를 담은 ‘셀렉트스타 인공지능 인사이트’를 9일 발표했다.

 

인공지능 학습데이터 플랫폼인 셀렉트스타는 지난 2018년부터 올해 상반기까지 약 5년간 14개 분야의 데이터를 수집·가공했다. 프로젝트 금액이 큰 순으로 보자면, ▲언어(40.2%) 카테고리가 가장 컸다. 이어서 ▲뷰티(6.4%) ▲예술(5.6%) ▲사람(5.3%) ▲건강(4.4%) ▲동물(4%) ▲자동차(3.8%) ▲식품(3.7%) 순이었다.

 

셀렉트스타가 발표한 인사이트 자료에 따르면, 언어 데이터는 주로 자연어 처리(NLP)나 자연어 이해(NLU)에 활용됐다. NLP와 NLU는 스마트 어시스턴트, 음성 인식, 검색 결과, 언어 번역, 텍스트 분석, 키워드 분석 등 활용 범위가 넓은 것이 특징이다. 한편 초기 AI가 단순하게 문구 또는 문서를 인식했다면, 이제는 사람의 감정이나 특징(사투리, 악플 등)까지 파악이 가능하다고 셀렉트스타 측은 설명했다. 음성 AI도 초기에는 단순히 언어를 인식하는 것에서 출발했지만, 이제는 인식에서 나아가 사람의 감정을 읽거나 표현하는 단계로 진화하고 있다.

 

2020년 전후로 AI 기반 초개인화 기술의 연구개발도 활발해졌다. 시장의 중심이 판매자에서 구매자로 옮겨갔고 온라인 구매가 증가하면서 추천, 고급 검색, 채굴, 매칭 알고리즘 등 초개인화 AI 개발과 고도화를 위한 학습용 데이터 수집·가공의 필요성이 커졌다. 특히 AI 기술 기반으로 시장에 뛰어든 스타트업이 늘어나면서 다양한 분야의 학습데이터가 구축되고 있다. 예컨대 셀렉트스타는 ▲개인 취향 맞춤 의류 추천 AI를 위한 의류 및 패션 이미지 태깅 데이터셋 ▲소비자 만족도 분석 AI를 위한 상품 리뷰 데이터셋 ▲음악 리뷰에 대한 감정 태깅 데이터셋 ▲건강 관리 AI를 위한 홍채 이미지 라벨링 데이터셋 ▲코로나19 시대 안면 인식을 위한 마스크 착용 사진 수집 및 라벨링 데이터셋 등을 구축한 바 있다. 다만 현재까지 국내 시장은 PoC(기술검증) 형태의 시도가 중심인데, 이는 서비스나 사업의 성공에서 ‘AI 성능’ 보다는 다른 요인의 영향이 비교적 크기 때문이라는 게 셀렉트스타의 분석이다.

 

신호욱 셀렉트스타 대표는 “셀렉트스타는 인공지능을 개발하는데 필수적인 ‘정확하고 일관된 학습데이터’를 생산하는 회사이면서 200개 이상의 타사와 협업을 통해 어떤 회사에서 어떤 인공지능을 만드는지 파악할 수 있기 때문에 이번 인사이트 자료를 발표할 수 있었다”고 설명했다. 이어 “AI 성능 향상은 데이터의 생산 및 관리 수준 규모와 비례한다”며 “AI Transformation이 전 세계적인 트렌드인 만큼 국내 AI 시장의 잠재력도 높다”고 강조했다.

 

셀렉트스타 인공지능 인사이트에 대한 자세한 내용과 파일 다운로드는 셀렉트스타 공식 블로그에서 확인 가능하다.

저작권자 Ⓒ시사뉴스
제보가 세상을 바꿉니다.
sisa3228@hanmail.net





커버&이슈

더보기


경제

더보기
이노비즈협회, '글로벌 혁신 기업의 돌파전략' 주제로 제93회 모닝포럼 개최
[시사뉴스 홍경의 기자] 이노비즈협회는 오는 29일 서울 강남구 삼정호텔 아도니스홀에서 「새로운 신시장을 개척하는 글로벌 혁신 기업의 돌파전략」을 주제로 ‘제93회 이노비즈 모닝포럼’을 개최한다. 이번 모닝포럼은 급변하는 글로벌 시장 환경 속에서 이노비즈기업이 지속가능한 성장동력을 확보할 수 있는 전략적 방향을 모색하기 위해 마련된 것으로, 강형근 HK&Company 대표를 초청해 실전 경영 노하우를 공유하는 시간을 갖는다. 최근 전 세계적으로 공급망 재편, ESG 경영, 디지털 전환 등 산업 전반의 구조 변화가 가속화되면서 중소기업은 기존 내수 중심 성장 모델의 한계에 직면하고 있다. 이에 협회는 ‘신시장 개척’과 ‘혁신 경영전략’을 통해 이노비즈기업이 위기를 기회로 전환하는 방법을 제시하고자 이번 포럼을 기획했다. 특히 이날 강연자로 나서는 강형근 대표는 아디다스코리아에서 브랜드 리포지셔닝과 시장점유율 확대를 주도한 인물로, 글로벌 기업에서 축적한 조직혁신, 브랜드 전략, 리더십 전환의 노하우를 이노비즈기업의 현실에 맞춰 전달할 예정이다. 포럼 참가를 희망하는 경우 10월 24일(금)까지 이노비즈협회 공식 홈페이지에서 온라인 신청하면 된다. 협회

사회

더보기

문화

더보기

오피니언

더보기
【박성태 칼럼】 스포트라이트 받는 주인공 뒤에 숨은 조력자를 기억하자
지난 14일 서울 월드컵경기장에서 열린 한국과 파라과이의 축구 평가전에서 스포트라이트를 받은 선수는 단연 오현규였다. 그는 후반 30분 승리에 쐐기를 박는 결정적인 골을 넣으며 언론의 헤드라인을 장식했다. 그러나 그 골의 배후에는 수비수 두 명을 제치는 현란한 드리블 후 냉정히 경기의 흐름을 읽고 찬스를 만들어낸 또 다른 주인공이 있었다. 바로 이강인이다. 그는 전방으로 빠르게 침투한 오현규에게 정확한 타이밍의 패스를 연결해 골의 90%를 만들어 내었다고 해도 과언이 아니다. 그러나 경기가 끝난 후 조명은 오직 골을 넣은 선수에게만 쏟아졌고, 이강인의 이름은 짤막이 언급되었다. 지난 21일 한국프로야구 2025 플레이오프 한화 대 삼성의 3차전에서 한화가 5대4로 역전승을 거둔 뒤, 단연 승리의 주역으로 스포트라이트를 받은 선수는 구원투수로 나와 4이닝 무실점으로 역투한 문동주였다. 그런데 사실 한화가 역전승을 할 수 있었던 것은 상대적으로 어린 문동주를 노련한 투수 리드로 이끌어간 최재훈 포수가 있었기 때문이다. 경기가 끝난 후 역투한 문동주와 역전 투런 홈런을 친 노시환만 승리의 주역으로 스포트라이트를 받았고 최재훈의 이름은 언급조차 없다. 이러한 장면은