[실시간 온라인] 파이썬을 활용한 머신러닝 기반 문서 분류

Introduction

자연어 처리는 인공지능을 대표하는 분야 중 하나로서 그중 문서 분류는 텍스트 데이터를 기반으로 하는 수많은 어플리케이션에 적용할 수 있어 학습 가치가 높습니다.

문서 분류(Text Classification)은 주어진 문서를 사용자의 목적에 따라 일정한 범주로 분류하는 문제입니다. 인터넷의 발전과 전산 기술의 발달에 따라 전산화된 문서의 양이 점점 더 증가하고 있으며 필요에 따라 문서를 적절하게 분류하는 것은 중요한 문제로 부상하고 있습니다. 최근에는 머신러닝/딥러닝 기반의 자연어 처리 모델이 이러한 문제를 해결하기 위한 방법론으로 활용되고 있습니다. 대표적인 사례로는 가짜 뉴스를 판별하기 위한 분류, 상품 구매자의 리뷰 분류가 있습니다.

본 강의는 문서 분류을 위한 자연어 처리 모델 중 TF-IDF를 기반으로 머신러닝을 활용한 방법과 CNN, LSTM 등의 딥러닝 모델을 활용하는 방법을 익힙니다.

본 강의를 수강하고 나면 자연어 처리에 대한 전반적인 이해와 함께 문서 분류를 위한 머신러닝/딥러닝 모델을 구현하는 능력을 갖출 수 있습니다.

문서 분류를 활용할 수 있는 분야 예시

  • 스펨 메일 분류
  • 소비자의 리뷰 분석을 통한 서비스 품질 향상
  • 가짜 뉴스 판별
  • 우울증 환자의 발화 내용을 분석하여 증상의 심각도 판별 
  • 게임 내 대화 내용 분석을 통한 악성 유저 판별

Goal

강의 목표

자연어 처리에 대한 이해
자연어 처리가 무엇이고 어떻게 활용할 수 있는지 이해합니다.

머신러닝/딥러닝 이론 학습
문서 분류에 활용되는 대표적인 머신러닝/딥러닝 모델의 이론을 학습합니다.

데이터 전처리 방법 학습
인공지능을 학습시키는 데 용이하게 텍스트 데이터를 전처리하는 방법을 익힙니다.

필수 라이브러리 학습
Numpy, Pandas, Scikit Learn, Pytorch 와 같이 머신러닝/딥러닝 모델을 설계하기 위한 라이브러리를 학습합니다.

문서 분류를 위한 머신러닝/딥러닝 모델 구현
실제로 데이터를 활용해 문서 분류를 위한 머신러닝/딥러닝 모델을 구현하는 시간을 가집니다.

Point

강의를 들으시면 다음의 질문에 답할 수 있게 됩니다

  1. 머신러닝과 딥러닝의 차이가 무엇인가?
  2. 대표적인 머신러닝 모델은 무엇이며 학습 원리는 무엇인가?
  3. 대표적인 딥러닝 모델은 무엇이며 학습 원리는 무엇인가?
  4. 자연어 처리가 무엇이며 어떤 분야에 활용할 수 있는가?
  5. TF-IDF란 무엇인가?
  6. Word Embedding이란 무엇인가?
  7. Sequence Model이란 무엇인가?
  8. Pre-trained Language Model이란 무엇인가?
  9. 인공지능 학습을 위해 텍스트 데이터를 전처리 하는 방법은 무엇인가?
  10. 어떻게 텍스트 분류를 위한 프로그램을 구축할 수 있는가?

For YOU

이런 분들께 추천드립니다!

머신러닝/딥러닝 활용 문서분류에 관심 있는 분

머신러닝/딥러닝을 활용한 문서 분류에 관심이 있는 대학생/대학원생/취준생/직장인

자연어 처리의 전반적인 이해에 관심 있는 분

자연어 처리에 대한 전반적인 이해를 원하는 대학생/대학원생/취준생/직장인

Professor

이종민

  • 現 알디노 연구원
  • 성균관대학교 인공지능학과 석사 과정
  • 국내 특허 출원 2건, 소프트웨어 등록 2건, 논문 게재 1건
  • 과학기술정보통신부 주관 프로젝트 2건 참여 중

Professor's interview

이종민 강사님

  • 안녕하세요, 짧게 자기소개 부탁드려요.

현재 성균관대학교 인공지능학과에서 석사 과정을 밟고 있습니다. 자연어 처리를 주전공으로 삼아 챗봇, 문서 분류, 형태소 분석기 등을 위한 인공지능을 개발하고 있습니다.

  • 현재 하시는 일에 대해서 더 자세히 설명해주실 수 있나요?

자연어 처리는 우리가 일상적으로 사용하는 자연어를 분석하여 새로운 가치를 창출하는 분야입니다. 문맥을 이해해 화자의 의도를 분석하거나 다른 나라 언어로 번역 또는 이용자와 자연스러운 대화를 생성하는 등 매우 다양한 일이 자연어 처리를 통해 구현할 수 있습니다. 저는 현재 의료 기관과 협력하여 자연어 처리를 이용해 환자 분의 상태를 분석하는 인공지능을 중점적으로 개발하고 있습니다.

  • 이번 교육 과정을 기획하게 되신 계기는 무엇인가요?

지식을 누군가와 공유하는데 많은 관심이 있습니다. 저의 지식과 경험을 아낌없이 나누어 이번 강의가 수강생 분들께 자연어 처리란 무엇인지, 어떤 단계를 거쳐 인공지능을 개발하는지 알게 되는 시간이 되었으면 합니다.

  • 이 강의에 대한 기대감이 있으시다면?

최근 인공지능 발전에 힘입어 산업 전반에 딥러닝이 활용되는 사례가 급속하게 늘어나고 있습니다. 이번 강의를 통해 수강생 분들이 문서 분석을 위한 인공지능의 원리를 이해하고 실습을 통해 간단한 문서 분석기를 개발할 수 있는 능력을 갖출 수 있으실 것으로 기대합니다.

  • 마지막으로 수강생 분들에게 당부의 말씀 부탁드립니다.

앞으로도 인공지능은 우리들의 일상 전반에 큰 영향을 미칠 기술입니다. 이번 강의를 통해 여러분들이 자연어 처리에 대한 이해도를 높이고 더 큰 관심을 가지는 계기가 되었으면 합니다.

#파이썬 #머신러닝 #딥러닝 #자연어처리

Curriculum

커리큘럼

1장 | 자연어처리 개요 및 개발 환경과 라이브러리

머신러닝 기반 문서분류를 위한 기본 지식을 쌓습니다. 자연어 처리 개요를 학습하고 관련 개발환경과 라이브러리를 학습합니다.

  • 자연어 처리란 무엇인가?
  • Colab에 대한 이해 및 필수 라이브러리 소개

2장 | 데이터 전처리

문서분류를 위해 필수적인 데이터 전처리에 대해 알아보고 실습합니다.

  • 전처리란?
  • 자연어 처리를 위한 전처리

3장 | 머신러닝을 활용한 문서 분류

머신러닝을 활용한 다양한 문서 분류 기법에 대해 학습합니다.

  • TF-IDF
  • SVM
  • Decision Tree
  • Random Forest
  • XGBoost

4장 | 딥러닝을 활용한 문서분류

딥러닝을 활용한 다양한 문서분류에 대해 학습합니다.

  • Perceptron
  • Multi Layer Perceptron
  • Convolutional Neural Network
  • Recurrent Neural Network
  • Long Short-Term Memory

수강 방법

[ 실시간 온라인 강의 ]
수강신청을 해주신 분들께 개별적으로 온라인 수강을 위한 링크를 보내드립니다.
강의자료는 당일 배포합니다

일정 및 시수

일정 : 2021년 6월 19일, 6월 26일 / 토요일 14:00~18:00
시수 : 2회, 총 8시간

유의 사항

개별 노트북 필수 지참, 세금계산서 발급가능

강의안내

1
개강 전에 개강안내 메일을 개별적으로 전달드립니다.
정해진 시간에 화상회의 솔루션 Zoom을 통해 진행됩니다. Zoom 접속링크는 개별적으로 전송합니다.
개강 1일 전에 강의교재 PDF 파일을 개별 이메일로 발송해 드립니다.
환불을 원하실 경우 [ 성함, 환불하고자 하는 강의명, 환불 사유 ] 정보를 edu@fins.ai 이메일로 보내주세요. 정보 확인 후 환불 도와드리겠습니다.

결제 안내

  • 대학(원)생 / 단체 / 기수강생 할인 가능합니다. (* 타쿠폰과 중복할인은 불가)
  • 카드 결제시 최대 6개월 무이자 할부 가능합니다.
  • 세금계산서 발급 가능합니다. 담당자(bill@fininsight.co.kr)에게 연락주시면 더 자세히 안내해 드리겠습니다.


인터넷 결제환경 안내

  • Windows 7, 크롬 브라우저에 최적화 되어있습니다. 인터넷 익스플로러는 버전 9 이상을 권장합니다.
  • iOS에서는 현재 결제가 불가합니다. 타 방식 이용을 권해 드립니다.
  • 맥북에서는 Safari(사파리)에서 결제가 가능합니다.


강의 유의사항

  • 본 강의에는 교재비가 포함되어 있습니다.
  • 강의의 최소 인원이 미달될 경우 일정이 연기될 수 있습니다.
  • 일정 연기 시, 수강생 분들께 개강 3일전 개별 연락을 드립니다.


인사이트 캠퍼스 지기 모집

혜택

  • 본 강의 무료 수강
  • 본 강의 외의 수강하고 싶은 강의는 50% 할인 혜택
  • 인사이트 캠퍼스지기 활동 인증서 발급
  • 금융권 진출 희망 시 진로 상담 및 네트워킹 제공 (우수 활동지기는 추천서 제공)
  • 핀인사이트 취업 지원 시 우대

모집 대상

  • 해당 강의 관련 학과 전일제 대학(원)생 또는 관심이 많은 타과 전일제 대학(원)생
  • 인원: 강의 당 1명

우대사항

  • 인사이트 캠퍼스 기 수강자
  • 해당 강의 관련 프로젝트 경험자
  • 해당 강의 관련 컴퓨터 언어 활용 가능자

활동 내용

  • 수강생들이 효과적으로 강의를 수강할 수 있도록 돕는 역할
  • 운영을 위한 세부사항을 기획하며, 다음 기수 수강생 모집 준비를 지원하는 역할
  • 해당 강의 종료 후 수강생 인터뷰 작성 (A4 1장 분량) – 차기 강의 개발 전략에 참여

신청 방법

  • 아래 신청 버튼을 통해 캠퍼스지기를 신청해주시면, 신청하신 모든 분들께 해당 강의 개강 1주 전까지 개별 연락 드립니다. 
  • https://goo.gl/forms/5KsDKKkUywVKPbZB2



위시리스트에 추가
수강신청하기
신청자: 6 students
일정: 2021년 6월 19일, 6월 26일 / 토요일 14:00~18:00
강의: 1
시수: 2회, 총 8시간
레벨: Beginner