자주 묻는 머신러닝 인터뷰 질문 및 답변 50선

자료실
기사
작성자
인사이트캠퍼스
작성일
2020-05-11 18:04
조회
11795

Top 50 Frequently Asked Machine Learning Interview Questions and Answers

자주 묻는 머신러닝 인터뷰 질문 및 답변 50선



 

* 이 기사는 Ubuntupit에 작성된 Asmita Ashrin의 글을 번역하였습니다.

 

현재 머신러닝, 인공지능, 데이터 과학은 이 산업과 기술이 주도하는 세계에서 다음 혁명을 가져올 가장 큰 호황 요인이다. 따라서, 새로운 학사 데이터 과학자들과 머신러닝 개발자들의 특정한 지식을 특정 영역에 적용하기를 기다리는 많은 기회들이 있다. 하지만, 생각하는 것처럼 그렇게 쉽지는 않다. 당신이 거쳐야 할 면접 절차는 분명 매우 어려울 것이고, 당신은 강력한 경쟁자들을 갖게 될 것이다. 게다가, 당신의 기술은 다양한 방식으로 시험될 것이다. 기술상의, 프로그래밍 기술, 문제 해결 능력, 그리고 머신러닝 기술을 효율적이고 효과적으로 적용하는 능력, 그리고 머신러닝에 대한 전반적인 지식등이 있다. 당신의 다가오는 면접을 돕기 위해, 이 게시물에는 자주 질문 받는 머신러닝 면접 질문을 정리했다.

 

머신 러닝 인터뷰 질문 및 답변들

전통적으로 머신러닝 개발자를 모집하기 위해서 여러 종류의 머신러닝 면접 질문을 한다. 첫째, 몇몇의 기본적인 머신러닝 질문들이 질문되어진다. 그런 다음, 머신러닝 알고리즘, 비교, 이점 및 단점이 질문된다. 마지막으로, 이러한 알고리즘과 기법을 이용한 문제해결 기술을 검토한다. 여기에 인터뷰 여정을 가이드하기 위한 머신러닝에 대한 인터뷰 질문들의 개요를 소개한다.

 

Q-1: 학교 다니는 학생처럼 머신러닝의 개념을 설명하라

머신러닝의 개념은 매우 간단하고 이해하기 쉽다. 마치 아기가 걸음마를 배우는 것과 같다. 아기가 넘어질 때마다, 아기는 점차 자신의 다리를 똑바로 세워야만 움직일 수 있다는 것을 깨닫는다. 아기는 넘어질 때 고통을 느낀다. 하지만, 다시는 그렇게 걷지 않아야 하는 것을 배운다. 때때로 아기는 걷는걸 도와줄 수 있는 것을 찾는다. 이것이 기계가 점차적으로 발전하는 방법이다. 첫번째로 프로토타입을 개발한다. 그리고 그 요구조건으로 그것을 지속적으로 개선한다.

 

Q-2: 머신러닝이 무엇에 관한 것인지 설명하라

ml definition

머신러닝(Machine Learning)은 인간과 똑같이 행동할 수 있을 정도로 지능이 높은 시스템을 개발하는 알고리즘의 연구다. 그것은 명시적인 지시 없이 학습할 수 있는 능력을 가진 기계나 장치를 만든다. 머신러닝의 현상은 기계가 자동으로 학습하고 패턴을 식별하며 결정을 내릴 수 있게 한다.

 

Q-3: 지도학습 머신러닝과 비지도학습 머신러닝의 핵심 차이점

supervised vs. unsupervised

이 질문은 머신러닝에 관한 가장 흔한 면접 질문 중 하나이다. 또한, 이것은 기본적인 ml(머신러닝) 질문들 중 하나이다. 기계와 모델을 교육하려면 지도학습에는 분류된 데이터가 필요하다. 이것은 일정량의 데이터가 이미 실제 산출물을 지니고 있다는 것을 의미한다. 주요한 차이점으로, 우리는 비지도학습에 분류된 데이터가 필요하지 않다.

 

Q-4: 딥러닝과 머신러닝은 어떻게 다른가?

deep learning vs machine learning

이러한 유형의 질문은 딥러닝 면접 질문에서 매우 흔하며, 면접관이 후보자를 정당화하기 위해 종종 질문한다. 우리는 딥러닝을 머신러닝에 통합할 수 있고, 그 뒤에 머신러닝을 인공지능에 통합할 수 있고, 그것에 의하여 세 가지를 모두 연결한다. 이것은 각 범주가 다른 범주의 하위 범주이기 때문에 가능하다. 그러므로 우리는 또한 이것을 머신러닝의 진보된 수준이라고 말할 수 있다. 그러나 그럼에도 불구하고 딥러닝의 해석능력은 머신러닝보다 10배나 빠르다.

 

Q-5: 데이터 마이닝과 머신러닝의 차이점

Data-Mining-vs-Machine-Learning

어떤 종류의 ML (머신러닝) 인터뷰 질문에서도 이런 종류의 질문은 매우 흔하다. 또한, 만약 당신의 기본이 명확하다면, 당신은 이러한 유형의 질문에 쉽게 대답할 수 있다. 머신러닝과 데이터 마이닝이 몇몇의 비슷한 점을 공유하기 때문에 서로 완전히 다르다고 말하는 것은 틀린 말이겠지만, 한편으로는 미세한 선이 두 가지 모두를 다르게 만든다.

핵심 차이는 그 의미에 있다. 데이터 마이닝이라는 용어는 데이터를 채굴함으로써 패턴을 추출하는 것에 해당하며, 머신러닝이라는 용어는 자율적인 기계를 만드는 것을 의미한다. 데이터 마이닝의 주된 목적은 미래에 사용될 수 있는 숨겨진 패턴을 찾기 위해 비정형 데이터를 사용하는 것이다.

한편, 머신러닝의 목적은 환경에 따라 독자적으로 학습할 수 있는 지능형 머신을 구축하는 것이다. 

 

Q-6: 인공지능과 머신러닝의 차이점

ml vs ai

머신러닝이나 인공지능에 관한 거의 모든 면접 질문에서, 인공지능과 머신러닝의 차이점에 관한 질문은 매우 흔한 질문이다. 이것은 대부분의 응시자들이 그 둘이 같은 것이라고 생각하기 때문이다. 그들 사이에는 결정적으로 분명한 구분이 있지만, 인공지능과 머신러닝이 서로의 대신으로 사용되는 경우가 있고 이것이 정확히 혼동의 근원이 된다. 

인공지능은 머신러닝보다 더 넓은 전망이다. 인공지능은 인간의 뇌의 인지 기능을 모방한다. 알고리즘을 기반으로 지능적인 방식으로 과제를 수행하는 것이 AI의 목적이다. 반면 머신러닝은 인공지능의 하위 분류이다. 명시적으로 프로그램화되지 않고 학습할 수 있도록 하는 방식으로 자율적인 기계를 개발하는 것이 머신러닝의 목표다.

 

Q-7: 인기 있는 5가지 머신러닝 알고리즘에 대해 설명하라

ml algo

만약 누군가가 인공지능과 머신러닝 프로젝트를 개발하기를 원한다면, 머신러닝 알고리즘을 선택하는 것에 있어 몇가지 옵션이 있다. 시스템 수요에 따라 누구나 손쉽게 적절한 알고리즘을 선택할 수 있다. 5가지 머신러닝 알고리즘은 Naive Bayes, Support Vector Machine, Decision Tree, K- Nearest Neighbor (KNN), K- means이다. 

 

Q-8: 머신러닝과 빅 데이터를 비교하라

만약 당신이 취업 시장의 새로운 구직자라면, 이런 종류의 질문은 ML (머신러닝) 면접 질문처럼 매우 흔하다. 면접관은 이런 유형의 질문을 함으로써 머신러닝에 대한 당신의 지식의 깊이를 이해하려고 시도한다. 빅데이터와 머신러닝의 주요 차이점은 정의나 목적에 있다.

빅 데이터는 대량의 데이터셋(빅 데이터)을 수집하고 분석하는 접근방식이다. 빅 데이터의 목적은 조직에 도움이 되는 대용량 데이터에서 유용한 숨겨진 패턴을 발견하는 것이다. 반대로 머신러닝은 명시적인 지시 없이 어떤 일이든 수행할 수 있는 지능형 기기를 만드는 연구이다.

 

Q-9: Decision Trees (의사결정나무)의 장단점

의사결정나무의 유의적인 장점은 이것이 어떠한 결정의 가능한 결과를 추적하여 차감하고, 모든 결과를 고려하여 이를 수행한다는 것이다. 각 가지에 따른 결과에 대한 광범위한 분석을 생성하고 추가 분석이 필요한 의사결정 노드를 식별한다.

의사결정나무의 주요 단점 중 하나는 불안정성인데, 이는 데이터의 사소한 변화만으로도 최적의 의사결정나무의 구조가 큰 영향을 받게 된다는 것을 의미한다. 때로는 값을 알 수 없고, 그 결과들이 매우 밀접하게 연관되어 있으며, 이것은 계산을 매우 복잡하게 만든다.

 

Q-10: 귀납적 머신러닝과 연역 머신러닝을 비교하라.

이런 종류의 질문은 ML (머신러닝) 인터뷰에서 꽤 흔하게 질문된다. 연역 머신러닝은 어떤 면에서 증명될 수 있는 지식을 학습하기 위한 알고리즘을 연구한다. 문제 해결자의 속도를 높이기 위해, 이러한 방법은 일반적으로 기존의 지식을 활용하여 지식을 그들에게 연역적으로 더함으로써 사용된다. 이것은 더 빠른 해결책을 가져올 것이다.

귀납적 학습의 관점에서 보면, 당신에게 주어질 특정 입력 샘플(x)과 출력 샘플(f(x))에서 함수 (f)를 추정하는 것이 문제가 될 것임을 알 수 있을 것이다. 좀 더 구체적으로 말하면, 표본으로부터 일반화해야 하는데, 여기서 문제가 발생한다. 함수를 유용하게 만드는 것은 앞으로 새로운 샘플에 대한 산출물을 더 쉽게 추정하기 위해 직면해야 할 또 다른 문제이다.

 

Q-11: 신경망의 장단점을 언급하라

Neural Networks

이것은 매우 중요한 머신러닝 면접 질문이며 또한 당신의 모든 딥러닝 면접 질문들 중 주요 질문으로 작용한다. 신경망의 주요 장점은 대량의 데이터 세트를 처리할 수 있다는 것이다. 의존 변수와 독립 변수 사이의 복잡한 비선형 관계를 은연중에 탐지할 수 있다. 신경망은 몇몇 단점이 유지될 수 밖에 없지만 거의 모든 다른 머신러닝 알고리즘보다 더 중요하다.

black-box nature 같은 것은 신경망의 가장 잘 알려진 단점 중 하나이다. 이것을 더 단순화하자면, 당신은 NN (신경망)이 당신에게 어떤 특정한 결과를 줄 때마다 어떻게 혹은 왜 이것을 도출해 냈는지조차 알 수 없을 것이다.

 

Q-12: 분류 문제에 적합한 머신러닝 알고리즘을 선택하는 데 필요한 단계들

첫째, 당신은 다른 머신러닝 알고리즘으로 향하기 전에 당신의 데이터, 당신의 제약, 그리고 당신의 문제들을 명확하게 알아야 한다. 둘째로, 어떤 종류의 데이터를 가지고 있는지 이해해야 하는데, 왜냐하면 이것이 어떤 알고리즘을 사용해야 하는지를 결정하는 데 주요한 역할을 하기 때문이다. 

이 단계 뒤는 입력별 분류와 출력별 분류의 2단계 프로세스인 데이터 분류 단계가 있다. 다음 단계는 제약 사항을 이해하는 것이다. 데이터 스토리지 용량은 얼마인가 또는 예측 속도가 얼마나 빨라야 하는지 등이 있다.

마지막으로, 사용할 수 있는 머신러닝 알고리즘을 찾아 현명하게 실행해라. 이와 함께 그리드 서치, 랜덤 서치, 베이지안 최적화의 세 가지 방법으로 수행될 수 있는 하이퍼파라미터를 최적화하도록 노력하라.

 

Q-13: "트레이닝 세트"와 "테스트 세트"의 용어를 설명할 수 있는가?

다양한 행동을 수행하기 위한 모델을 훈련시키기 위해, 트레이닝 세트는 머신러닝에 사용된다. 그것은 다양한 API와 알고리즘의 도움으로 기계가 자동으로 작동하도록 훈련시키는 것을 돕는다. 특정 모델을 트레이닝 세트에 적합시킴으로써 이 세트가 처리되고, 그 후에 이 적합된 모델을 사용하여 검증 세트의 관측치에 대한 반응을 예측하여 둘을 연결한다.

머신러닝 프로그램이 초기 트레이닝 데이터 세트에서 훈련된 후, 두 번째 데이터 세트, 즉 테스트 세트에서 테스트가 실시된다.

 

* 더 많은 머신러닝 인터뷰 질문 및 답변은 원문 사이트에서 확인할 수 있습니다.

 

전체 0

전체 642
번호 제목 작성자 작성일 추천 조회
공지사항
비밀글 파이썬으로 배우는 블록체인 구조와 이론 (위키북스)
finweb | 2019.07.05 | 추천 0 | 조회 23
finweb 2019.07.05 0 23
580
이상거래(Fraud) 탐지, 위험성 평가 등을 지원하는 핀테크 AI
인사이트캠퍼스 | 2020.09.07 | 추천 0 | 조회 508
인사이트캠퍼스 2020.09.07 0 508
579
인공지능은 당신의 돈을 더 스마트하게 해준다
인사이트캠퍼스 | 2020.09.07 | 추천 0 | 조회 350
인사이트캠퍼스 2020.09.07 0 350
578
게임 산업에서의 AI의 미래에 대한 예측 5가지
인사이트캠퍼스 | 2020.08.27 | 추천 0 | 조회 1422
인사이트캠퍼스 2020.08.27 0 1422
577
"강의에서 배운 attention network를 감성 분석이나 주제 분석에 활용해 보고 싶어요" (현준욱님 인터뷰)
인사이트캠퍼스 | 2020.08.14 | 추천 0 | 조회 629
인사이트캠퍼스 2020.08.14 0 629
576
15개의 데이터셋을 사용한 머신러닝 및 데이터 사이언스 프로젝트 아이디어
인사이트캠퍼스 | 2020.08.13 | 추천 0 | 조회 12881
인사이트캠퍼스 2020.08.13 0 12881
575
핀테크 혁신을 위한 5가지 AI 기반 기술
인사이트캠퍼스 | 2020.08.06 | 추천 0 | 조회 982
인사이트캠퍼스 2020.08.06 0 982
574
파이썬으로 단계별 첫 머신러닝 프로젝트 시작하기
인사이트캠퍼스 | 2020.07.28 | 추천 0 | 조회 2189
인사이트캠퍼스 2020.07.28 0 2189
573
25분 내에 알고리즘 트레이딩 코딩하기
인사이트캠퍼스 | 2020.07.22 | 추천 0 | 조회 1479
인사이트캠퍼스 2020.07.22 0 1479
572
시장의 미시구조와 마이크로 트레이딩 - 2
인사이트캠퍼스 | 2020.06.18 | 추천 0 | 조회 1110
인사이트캠퍼스 2020.06.18 0 1110
571
시장의 미시구조와 마이크로 트레이딩 - 1
인사이트캠퍼스 | 2020.06.15 | 추천 0 | 조회 1173
인사이트캠퍼스 2020.06.15 0 1173
570
딥러닝을 활용한 금융 시계열 분석 - 2
인사이트캠퍼스 | 2020.05.25 | 추천 0 | 조회 2709
인사이트캠퍼스 2020.05.25 0 2709
569
퀀텀 컴퓨팅의 실용화 방안
인사이트캠퍼스 | 2020.05.18 | 추천 0 | 조회 838
인사이트캠퍼스 2020.05.18 0 838
568
딥러닝을 활용한 금융 시계열 분석 - 1
인사이트캠퍼스 | 2020.05.18 | 추천 0 | 조회 2118
인사이트캠퍼스 2020.05.18 0 2118
567
동적 자산 배분과 유니버셜 포트폴리오
인사이트캠퍼스 | 2020.05.14 | 추천 0 | 조회 1269
인사이트캠퍼스 2020.05.14 0 1269
566
2020년 최고의 인공지능 및 머신러닝 소프트웨어 및 프레임워크 Top 20
인사이트캠퍼스 | 2020.05.13 | 추천 0 | 조회 5607
인사이트캠퍼스 2020.05.13 0 5607
565
자주 묻는 머신러닝 인터뷰 질문 및 답변 50선
인사이트캠퍼스 | 2020.05.11 | 추천 0 | 조회 11795
인사이트캠퍼스 2020.05.11 0 11795
564
좋은 vs 나쁜 액티브 펀드 관리 : 3 가지 지표
인사이트캠퍼스 | 2020.05.06 | 추천 0 | 조회 632
인사이트캠퍼스 2020.05.06 0 632
563
그녀는 돈의 보스: 여성 온라인 투자의 4대 트렌드
인사이트캠퍼스 | 2020.05.06 | 추천 0 | 조회 666
인사이트캠퍼스 2020.05.06 0 666
562
변동성 측정의 이해
인사이트캠퍼스 | 2020.05.06 | 추천 0 | 조회 1085
인사이트캠퍼스 2020.05.06 0 1085
561
새로운 재료를 찾는 데 있어 최적화를 촉진하는 신경망
인사이트캠퍼스 | 2020.04.29 | 추천 0 | 조회 711
인사이트캠퍼스 2020.04.29 0 711