전체기사

2025.09.07 (일)

  • 구름많음동두천 29.3℃
  • 맑음강릉 33.1℃
  • 구름많음서울 29.7℃
  • 구름조금대전 30.6℃
  • 구름조금대구 30.8℃
  • 맑음울산 31.3℃
  • 구름조금광주 30.5℃
  • 맑음부산 31.2℃
  • 맑음고창 31.0℃
  • 맑음제주 31.5℃
  • 구름많음강화 28.8℃
  • 구름조금보은 27.9℃
  • 맑음금산 29.4℃
  • 구름조금강진군 30.8℃
  • 맑음경주시 31.7℃
  • 구름조금거제 30.6℃
기상청 제공

e-biz

셀렉트스타, 1억 3천만건 AI 학습데이터 구축 프로젝트 분석 결과 발표

URL복사

한국어 데이터셋 진화 중, 초개인화 추천 연구개발 활발

 

[시사뉴스 김남규 기자] 셀렉트스타가 인공지능(AI) 학습데이터 구축 트렌드를 담은 ‘셀렉트스타 인공지능 인사이트’를 9일 발표했다.

 

인공지능 학습데이터 플랫폼인 셀렉트스타는 지난 2018년부터 올해 상반기까지 약 5년간 14개 분야의 데이터를 수집·가공했다. 프로젝트 금액이 큰 순으로 보자면, ▲언어(40.2%) 카테고리가 가장 컸다. 이어서 ▲뷰티(6.4%) ▲예술(5.6%) ▲사람(5.3%) ▲건강(4.4%) ▲동물(4%) ▲자동차(3.8%) ▲식품(3.7%) 순이었다.

 

셀렉트스타가 발표한 인사이트 자료에 따르면, 언어 데이터는 주로 자연어 처리(NLP)나 자연어 이해(NLU)에 활용됐다. NLP와 NLU는 스마트 어시스턴트, 음성 인식, 검색 결과, 언어 번역, 텍스트 분석, 키워드 분석 등 활용 범위가 넓은 것이 특징이다. 한편 초기 AI가 단순하게 문구 또는 문서를 인식했다면, 이제는 사람의 감정이나 특징(사투리, 악플 등)까지 파악이 가능하다고 셀렉트스타 측은 설명했다. 음성 AI도 초기에는 단순히 언어를 인식하는 것에서 출발했지만, 이제는 인식에서 나아가 사람의 감정을 읽거나 표현하는 단계로 진화하고 있다.

 

2020년 전후로 AI 기반 초개인화 기술의 연구개발도 활발해졌다. 시장의 중심이 판매자에서 구매자로 옮겨갔고 온라인 구매가 증가하면서 추천, 고급 검색, 채굴, 매칭 알고리즘 등 초개인화 AI 개발과 고도화를 위한 학습용 데이터 수집·가공의 필요성이 커졌다. 특히 AI 기술 기반으로 시장에 뛰어든 스타트업이 늘어나면서 다양한 분야의 학습데이터가 구축되고 있다. 예컨대 셀렉트스타는 ▲개인 취향 맞춤 의류 추천 AI를 위한 의류 및 패션 이미지 태깅 데이터셋 ▲소비자 만족도 분석 AI를 위한 상품 리뷰 데이터셋 ▲음악 리뷰에 대한 감정 태깅 데이터셋 ▲건강 관리 AI를 위한 홍채 이미지 라벨링 데이터셋 ▲코로나19 시대 안면 인식을 위한 마스크 착용 사진 수집 및 라벨링 데이터셋 등을 구축한 바 있다. 다만 현재까지 국내 시장은 PoC(기술검증) 형태의 시도가 중심인데, 이는 서비스나 사업의 성공에서 ‘AI 성능’ 보다는 다른 요인의 영향이 비교적 크기 때문이라는 게 셀렉트스타의 분석이다.

 

신호욱 셀렉트스타 대표는 “셀렉트스타는 인공지능을 개발하는데 필수적인 ‘정확하고 일관된 학습데이터’를 생산하는 회사이면서 200개 이상의 타사와 협업을 통해 어떤 회사에서 어떤 인공지능을 만드는지 파악할 수 있기 때문에 이번 인사이트 자료를 발표할 수 있었다”고 설명했다. 이어 “AI 성능 향상은 데이터의 생산 및 관리 수준 규모와 비례한다”며 “AI Transformation이 전 세계적인 트렌드인 만큼 국내 AI 시장의 잠재력도 높다”고 강조했다.

 

셀렉트스타 인공지능 인사이트에 대한 자세한 내용과 파일 다운로드는 셀렉트스타 공식 블로그에서 확인 가능하다.

저작권자 Ⓒ시사뉴스
제보가 세상을 바꿉니다.
sisa3228@hanmail.net





커버&이슈

더보기

정치

더보기


사회

더보기
호산대, 대학일자리플러스센터 고용노동부와 간호대학 취업활성화 간담회 개최
[시사뉴스 홍경의 기자] 호산대학교 대학일자리플러스센터는 지난 달 28일(목) 창의예술관 2층 대학원격교육지원센터에서 고용노동부와 함께 간호학과 취업 활성화를 위한 간담회를 개최했다. 이번 간담회에는 ▲대구고용센터 방언희 팀장 ▲황정덕 파트장 ▲호산대학교 간호학과 황혜정 교수, 김영미 교수 ▲전상훈 대학일자리플러스센터장 ▲오명수 부센터장 ▲이성국 팀장 ▲문종훈 컨설턴트 ▲이진호 주무관 등 총 9명이 참석했다. 이번회의에서는 고용노동부가 지원하는 미래내일 일경험 인턴 사업을 호산대학교 간호학과와 연계할 수 있는 방안이 중점적으로 논의됐다. 이를 통해 학생들의 현장 경험을 확대하고, 병원 및 의료기관의 인력 수요를 충족시킬 수 있는 상호 윈윈 구조 마련이 주요 의제로 다뤄졌다. 또한 간호학과 교수진은 간호사 취업 현황과 애로사항을 상세히 공유했으며, 이를 들은 고용노동부 관계자들은 보건계열이 참여할 수 있는 다양한 연계 사업들을 안내했다. 이번 간담회는 협업의 기틀을 마련한 자리로 평가된다. 양측은 향후 대학일자리플러스센터를 중심으로 구체적인 실행 방안을 마련하고, 고용노동부와 긴밀히 협력해 간호학과 취업률 제고에 실질적인 성과를 내겠다는 데 뜻을 모았다. 전상

문화

더보기
나와 타인을 이해하는 심리적 안내서
[시사뉴스 정춘옥 기자] 좋은땅출판사가 ‘에니어그램 명상상담 전략’을 펴냈다. 이 책은 현대인이 겪는 심리적 불안과 대인관계의 갈등을 다루며, 아홉 가지 성격 유형을 통해 자기 이해와 관계 회복의 길을 안내하는 심리 지침서다. 저자는 에니어그램 이론에 명상상담을 결합해 각 유형의 특성과 패턴을 드러내고, 이를 극복할 수 있는 구체적인 전략을 제시한다. 단순히 성격을 분류하는 데 그치지 않고, 어린 시절의 경험과 현재의 관계 문제를 연결해 설명함으로써 독자가 자기 성찰의 깊이를 더할 수 있도록 돕는다. 저자 김문자는 동방문화대학원대학교 명상심리상담학과에서 상담심리학 박사학위를 받았으며, 대학교 상담심리센터 객원 상담사를 역임한 바 있다. 현재는 명상에니어그램 교육원 원장으로 활동하며 명상과 심리상담을 접목한 다양한 연구와 실천을 이어가고 있다. 저자는 ‘명상상담프로그램이 여대생의 스트레스 감소에 미치는 영향’, ‘에니어그램을 활용한 영상관법이 분노 감소에 미치는 영향’, ‘에니어그램 명상상담 단일사례연구’ 등 여러 논문을 통해 그 효과를 입증해 온 학자이자 상담 전문가다. ‘에니어그램 명상상담 전략’은 명상이 내면의 불안을 직면하게 하고, 에니어그램이 그 불안

오피니언

더보기
【박성태 칼럼】 생성형 AI 활용…결국 사용자의 활용 능력과 방법에 달려 있다
지난 2022년 인공지능 전문 기업인 오픈AI에서 개발한 챗GPT를 비롯해 구글의 Gemini(제미나이), 중국의 AI기업에서 개발한 딥시크, 한국의 AI기업에서 개발한 뤼튼, 미국 캘리포니아에 본사를 두고 있는 중국계 미국기업이 개발한 젠스파크 등 생성형 AI 활용시대가 열리면서 연령층에 상관없이 생성형 AI 활용 열기가 뜨겁다. 몇 시간에서 며칠이 걸려야 할 수 있는 글쓰기, 자료정리, 자료검색, 보고서, 제안서 작성 등이 내용에 따라 10초~1시간이면 뚝딱이니 한번 사용해 본 사람들은 완전 AI 마니아가 되어 모든 것을 AI로 해결하려 한다, 이미 65세를 넘어 70세를 바라보는 필자는 아직도 대학에서 3학점 학점 수업을 진행하고 있다. 지난 2일 개강 첫날 학생들에게 한 학기 동안 글쓰기 과제물을 10회 정도 제출해야 하는데 생성형 AI를 활용해도 좋으나 그대로 퍼오는 것은 안 된다는 지침을 주었다. 그러면서 “교수님이 그대로 퍼오는지 여부를 체크 할수 있다”고 큰소리를 쳤다. 큰소리가 아니라 지난 학기에도 실제 그렇게 점검하고 체크해서 활용 정도에 따라 차등 평가를 실시했다. 이렇게 차등 평가를 할 수 있다는 것은 필자가 생성형 AI 활용 경험이 있