알라딘

헤더배너
상품평점 help

분류

이름:김창엽

최근작
2022년 5월 <그림으로 배우는 딥러닝>

그림으로 배우는 딥러닝

해가 지날수록 풀기 힘든 문제를 AI로 풀어보고자 노력하는 사람들을 많이 만난다. 문제의 본질을 고민하고, 여러 아이디어로 실험해보고, 피처를 새로 만들어보고, 네트워크 구조를 바꿔보고, 데이터를 더 모아보고, 잘못된 데이터가 없는지 또 검사해보고, 실험을 실패하고 다시 시도하는 등 고군분투하는 사람이 늘고 있다. 또한 AI나 ML 팀이 아닌 다른 부서에 AI나 머신러닝 지식을 전달하고 발표해야 하는 자리도 늘어나고 있다. 업무의 효율을 높이기 위해서는 AI를 적용해야 하고, 다른 회사와의 협업이나 사업 기회를 만드려면 연구 개발 조직이 아닌 부서에도 AI와 머신러닝 지식이 요구된다. 이 책은 마주치자마자 덮어 버리고 싶은 수식과 개발자가 아니면 굳이 알고 싶지 않은 코드를 제거하고 그림만으로 머신러닝, 딥러닝 이론을 설명한 책이다. 거부 반응 없이 머신러닝과 딥러닝에 최대한 가깝게 갈 수 있도록 저자가 많은 공을 들였다. 부족한 역자로 인해 저자의 노력이 사라지지 않도록 최선을 다해 번역했다. 아무쪼록 이 책이 머신러닝과 딥러닝에 입문할 때 수식과 코드 때문에 겁먹어 포기하지 않고, 이 분야의 이론을 전반적으로 훑어보고 이해하는 데 많은 도움이 됐으면 한다. - 김창엽

딥러닝 데이터 전처리 입문

알파고 이후로 제4차 산업혁명, 인공지능 등의 키워드와 마찬가지로 머신 러닝이라는 용어도 많은 회사와 대중에게 더욱 친숙해지고 있다. 하지만 많은 관심을 받고 있는 머신 러닝 분야에서 데이터 전처리의 중요성은 상대적으로 강조되지 못하는 분위기다. 데이터에 맞는 머신 러닝 알고리즘과 적절한 파라미터를 선택하는 것만큼 데이터 전처리 과정 또한 매우 중요하다. 양질의 데이터를 통해 좋은 결과를 만들어낼 수 있으므로, 올바른 데이터 전처리는 필수라 해도 과언이 아니다. 데이터 전처리는 꽤 노동집약적인 작업으로, 데이터 분석가는 전처리 작업에 많은 시간을 할애하고 있다. 머신 러닝 알고리즘과 도구를 소개하는 책은 다양하지만 전처리 과정을 쉽게 접할 수 있도록 소개하는 책은 드물다. 이 책에서는 먼저 데이터를 처리하는 방법을 알아보고 가장 널리 사용되는 파이썬을 사용해 JSON, CSV, XML 파일을 처리하는 방법을 살펴본다. 다음으로 실무에 매우 유용한 정규 표현식에 대해 알아보고 수치 데이터 분석에 유리한 R과 RStudio에 대해서도 배운다. 또한 데이터 수집을 위한 웹 크롤링과 대용량 데이터 처리를 위한 MongoDB에 대해서도 간단히 다룬다. 이 책을 통해 머신 러닝을 위한 데이터 전처리 학습에 도움을 얻길 바란다. 이 책이 머신 러닝에 처음 입문하는 분들에게 조금이나마 보탬이 됐으면 하는 바람이다.

머신 러닝을 활용한 컴퓨터 보안

데이터가 중요하다는 이야기는 오랫동안 들어봤을 겁니다. 생성되는 데이터는 나날이 증가하고, 데이터를 분석 및 가공하는 기술의 수요도 크게 늘어나고 있습니다. 하지만 데이터가 생성되는 양과 중요성에 비해 데이터를 분석하는 기술자와 기술 모두 공급이 부족한 상황이 이어지고 있습니다. 보안 분야에 머신 러닝 기술을 접목시키기는 생각만큼 쉽지 않습니다. 사람이 자세히 분석하더라도 문제가 있는지 없는지 파악하기 어려운 경우가 많다는 특성 때문입니다. 하지만 보안 분야에서 많은 경험을 쌓은 경우에 직감을 통해 정확한 분석을 할 수 있다는 것은 분명합니다. 그 동안의 누적된 경험이 직감이라는 휴리스틱을 형성해낸 것입니다. 자신 고유의 추론 엔진이라고 볼 수 있겠지요. 머신 러닝 기술을 보안에 접목시키는 일은 이러한 도메인 지식을 찾아내는 것이 아닐까요? 이 책은 다른 머신 러닝 관련 자료에서는 쉽게 찾아보기 어려운 보안 문제를 다루고 있습니다. 보안 분야의 비정형성으로 인해 이 책에서 모든 내용을 다루지는 못합니다. 하지만 보안 분야에 머신 러닝을 접목시키기 위해 어떠한 방식으로 접근해야 하는지 방향성을 제시해 주는 데는 탁월하며, 도움이 될 거라 생각합니다.

예제로 배우는 자연어 처리 기초

CNN, RNN(LSTM, GRU) 등을 다양한 방식으로 활용하는 많은 연구가 계속 진행돼 왔지만, 최근 트랜스포머(Transformer), ELMO, GPT, BERT 등의 연구를 기반으로 여러 자연어 처리 태스크에서도 뛰어난 성능을 나타내는 주목할 만한 여러 연구 결과들이 계속 발표되고 있다. 스마트폰에서 사용하는 여러 앱이나 방문하는 사이트에서도 챗봇을 제공하는 사례가 점점 늘어나고 있으며, 기업에서도 매일매일 쌓여가는 수많은 로그로부터 고객의 행동이나 생각, 소비 및 구매 패턴, 추천 방안, 보안 이슈들을 파악하고자 자연어 처리 알고리즘을 활용하고 있다. 이 책은 다양한 자연어 처리 알고리즘의 기반이 되는 기초 지식을 다룬다. 자연어 처리의 개념과 자연어 처리의 과정을 소개하고 품사 태깅, 불용어 처리, 정규화, 어간 추출, 표제어 추출 등 텍스트 데이터를 다룰 때 반드시 필요한 기반 기술을 하나씩 살펴본다. 실무에 다양한 방식으로 적용해볼 수 있는 텍스트 분류기를 만들어보고, 텍스트를 수집하는 데 반드시 필요한 기술인 스크래핑을 소개한다. 다음으로 대량의 문서를 일일이 읽지 않아도 문서의 주제를 파악할 수 있는 토픽 모델링 방법을 자세히 다루고, 활발한 연구가 이뤄지고 있는 텍스트 요약 및 생성 분야를 소개한다. 자연어 처리 분야에 딥러닝을 적용하는 데 가장 중요한 임베딩을 소개한 뒤, 실무에서 다양한 방식으로 적용해볼 수 있는 감성 분석 애플리케이션을 구현해본다. 이 책을 통해 자연어 처리 분야에 입문할 때 반드시 알아야 할 내용을 다양한 예제를 구현해가면서 쉽게 익힐 수 있을 것이다.

케라스로 구현하는 딥러닝과 강화학습

알파고와 이세돌 9단의 세기의 대결로 일반인들도 점점 머신 러닝에 관심을 갖게 됐다. 또한 많은 기업들이 머신 러닝을 적용해 다양한 문제를 해결해 나가기 시작한다. 자율주행 자동차와 의학 분야 등의 많은 산업 분야에도 머신 러닝으로 커다란 변화가 일어나고 있다. 구글 트렌드에서 'Machine Learning'을 검색하면 대한민국이 상위권에 랭크된다. 그만큼 국내에는 머신 러닝에 관심을 갖고 계신 분들이 많다고 생각된다. 얼마 전부터 많은 오프라인 스터디가 생기고 양질의 정보를 제공해주는 블로그가 많아졌다. 훌륭한 연구원 분들과 교수님들은 바쁜 와중에도 일반인들이 쉽게 머신 러닝을 접할 수 있도록 무료 강의를 배포하고 어려운 영어 논문을 이해하기 쉽도록 한글로 풀어서 설명해주고 있다. 기술이 발전하는 속도만큼 학습해야 할 것이 점점 늘어나고 있지만, 이런 분들의 노력이 있다는 건 정말 희소식이다. 이 책은 딥러닝의 근간을 이루는 신경망 기초에 대한 내용으로 시작해, 실세계에서 다양한 문제 해결에 활용하는 CNN, RNN 등을 학습한다. 최근 관심이 뜨거운 GAN에 대해서도 알아보고, 여러 상황에 맞는 다양한 신경망 구조에 대해 학습한다. 언어의 의미를 파악하고자 하는 텍스트 마이닝에서 널리 활용되는 단어 임베딩에 대해서도 다루고 있다. 마지막으로 알파고로 화제가 되었던 강화학습으로 간단한 게임을 플레이하며 쉽게 설명한다. 책에서 다루는 대부분의 신경망에 대한 소스 코드를 제공해 나중에 독자들이 이 코드를 기반으로 각자의 문제를 해결하는 데에 활용할 수 있을 것이다.

텐서플로 入門

알파고(AlphaGo) 덕분에 '인공지능', '머신 러닝', '딥 러닝'이라는 용어가 사람들에게 더 친숙해진 것 같습니다. 전 세계의 유망한 IT 기업들은 사용하고 있는 머신 러닝 프레임워크를 오픈소스로 공개하며 치열한 경쟁을 하고 있습니다. 학계에서도 머신 러닝 알고리즘의 정확도를 더 개선시키고자 노력하고 있으며, 기업에서도 내부의 문제를 푸는 데 머신 러닝을 적용해 하나씩 해결해 나가기 시작했습니다. 머신 러닝은 뇌 과학, 산업 공학, 생물학, 물리학, 컴퓨터 공학, 수학, 로봇 공학 등 많은 학문 분야와 연결돼 있습니다. 여러 분야에 걸쳐 있는 만큼 학습해야 하는 내용도 정말 많습니다. 머신 러닝을 공부하고자 하는 학생은 유투브(Youtube), 코세라(Coursera), 에드엑스(edX) 등 동영상 강의를 통해 해외 유명 대학의 수업을 쉽게 접할 수 있게 됐습니다. 이 강의들은 대부분 영어로 돼 있어 우리나라 학생들이 쉽게 이해하기에는 어려움이 있는 것 같습니다. 한국에서 머신 러닝을 배우고자하는 분들이 더 쉽게 접할 수 있도록 좋은 강의, 좋은 책들을 번역하는 데 힘쓰는 분들이 많아졌으면 좋겠습니다. 저자 잔카를로 자코네(Giancarlo Zaccone)는 산업과학 분야에서 10년 연구 프로젝트를 관리했고, 병렬 수치 연산 및 시각화에 관해 연구한 뒤 현재는 소프트웨어 엔지니어로 활동하고 있습니다. 이 책은 저자의 다년간 경험을 바탕으로 텐서플로를 처음 접하는 독자가 예제를 통해 머신 러닝과 딥 러닝을 배울 수 있도록 구성돼 있습니다. 텐서플로는 적은 라인의 코드로도 매우 복잡하고 어려운 알고리즘을 구현할 수 있게 구성돼, 각 알고리즘에 대해 수학적으로 깊이 이해하지 않더라도 활용할 수 있도록 환경을 제공합니다. 이 책에서 제공하는 예제를 차근차근 따라 하다 보면 머신 러닝 알고리즘의 원리를 쉽게 이해할 수 있을 것입니다.

텐서플로로 하는 딥러닝 기초와 응용

개발자마다 혹은 속한 조직에 따라 선호하는 딥러닝 라이브러리가 다양한 실정이다. 또한 논문 저자가 구현 코드를 공개하는 경우에도 딥러닝 라이브러리와 버전이 다양하다. 연구자나 개발자 입장에서는 이 코드를 완벽히 이해한 뒤 다시 본인의 선호 라이브러리로 구현할 상황이 생기게 된다. 이 책은 여러 라이브러리 중 텐서플로 1.x, 2.x 버전 사이의 큰 구조 변화를 소개한다. 이 책을 살펴보면서 텐서플로 1.x, 2.x의 근간을 이루는 개념을 이해하고 케라스와의 통합으로 얻는 이점에 대해 배울 수 있을 거라 기대한다. 이 책이 딥러닝을 공부하는 분들에게 조금이나마 보탬이 되면 좋겠다. 김창엽

가나다별 l l l l l l l l l l l l l l 기타
국내문학상수상자
국내어린이문학상수상자
해외문학상수상자
해외어린이문학상수상자