분류 전체보기
-
Part2 주요 알고리즘 이론과 실전문제의 Chapter6 정렬을 공부할 시간이다. 7월-12월간의 교육이 끝나고 이제부터 취업전선에 뛰어들기 전에 코딩테스트 실력을 갈고닦기 위해 다시 [이것이 코딩테스트다]로 공부중이다. 이번주에는 Part2 1회독을 한 후에 다음주부터 실전문제를 풀 예정이다. 그리고 1회독을 한 것을 기반으로 다시 머릿속으로 정리하려고 블로그에 포스팅 한다. 1. 정렬 - 정렬 : 데이터를 특정간 기준에 따라서 순서대로 나열하는 것 - 종류와 시간복잡도 내용 시간복잡도 선택 정렬 (Selection Sort) - 가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸고, 그 다음 작은 데이터를 선택해 앞에서 두 번째 데이터와 바꾸는 과정 반복 O(N제곱) 삽입 정렬 (Insetion..
[이것이 코딩테스트다] 정렬Part2 주요 알고리즘 이론과 실전문제의 Chapter6 정렬을 공부할 시간이다. 7월-12월간의 교육이 끝나고 이제부터 취업전선에 뛰어들기 전에 코딩테스트 실력을 갈고닦기 위해 다시 [이것이 코딩테스트다]로 공부중이다. 이번주에는 Part2 1회독을 한 후에 다음주부터 실전문제를 풀 예정이다. 그리고 1회독을 한 것을 기반으로 다시 머릿속으로 정리하려고 블로그에 포스팅 한다. 1. 정렬 - 정렬 : 데이터를 특정간 기준에 따라서 순서대로 나열하는 것 - 종류와 시간복잡도 내용 시간복잡도 선택 정렬 (Selection Sort) - 가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸고, 그 다음 작은 데이터를 선택해 앞에서 두 번째 데이터와 바꾸는 과정 반복 O(N제곱) 삽입 정렬 (Insetion..
2021.12.10 -
책의 Chapter5에 등장하는 DFS/BFS에 대해 공부하는 시간이다. 1. 꼭 필요한 자료구조 기초 - 탐색(Search) : 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정 - 자료구조(Data Structure) : 데이터를 표현하고 관리하고 처리하기 위한 구조 스택과 큐 삽입(Push) : 데이터 삽입 삭제(Pop) : 데이터 삭제 - 스택 : 선입후출 구조 또는 후입선출 구조 빈 배열 선언 append 함수로 데이터 삽입 pop 함수로 데이터 삭제 stack = [] stack.append(8) stack.append(0) stack.append(7) stack.pop() # pop은 가장 뒤쪽(오른쪽)에 있는 데이터를 꺼냄. stack.append(6) stack.append(0) pri..
[이것이 코딩테스트다] DFS(깊이 우선 탐색) / BFS(너비 우선 탐색)책의 Chapter5에 등장하는 DFS/BFS에 대해 공부하는 시간이다. 1. 꼭 필요한 자료구조 기초 - 탐색(Search) : 많은 양의 데이터 중에서 원하는 데이터를 찾는 과정 - 자료구조(Data Structure) : 데이터를 표현하고 관리하고 처리하기 위한 구조 스택과 큐 삽입(Push) : 데이터 삽입 삭제(Pop) : 데이터 삭제 - 스택 : 선입후출 구조 또는 후입선출 구조 빈 배열 선언 append 함수로 데이터 삽입 pop 함수로 데이터 삭제 stack = [] stack.append(8) stack.append(0) stack.append(7) stack.pop() # pop은 가장 뒤쪽(오른쪽)에 있는 데이터를 꺼냄. stack.append(6) stack.append(0) pri..
2021.12.07 -
Day2의 Topic Modeling 강의를 듣고 정리한 내용의 포스팅입니다. Topic Modeling은 Text Mining 기법 중에서 가장 많이 활용되고 있음. Topic Modeling은 Unsupervised Learning 기반 방법 중 하나로 말 그대로 여러 문서들에서 주제를 찾아내는 데에 사용하는 알고리즘 중 하나임. 아주 많은 문서의 주제들을 추출할 수 있고, 시간별로 이 방법을 적용하여 대중의 트렌드를 파악하는 등 다양하게 활용되고 있음. 1. Bag-of-Words Encoding of Text Documents - Bag-of-words vector 텍스트 데이터나 이미지 데이터는 비정형 데이터! 이를 정형 데이터(환자 정보인 나이,성별,몸무게 등이 테이블 형태로 되어있는 데이터)..
[DAY2] Topic ModelingDay2의 Topic Modeling 강의를 듣고 정리한 내용의 포스팅입니다. Topic Modeling은 Text Mining 기법 중에서 가장 많이 활용되고 있음. Topic Modeling은 Unsupervised Learning 기반 방법 중 하나로 말 그대로 여러 문서들에서 주제를 찾아내는 데에 사용하는 알고리즘 중 하나임. 아주 많은 문서의 주제들을 추출할 수 있고, 시간별로 이 방법을 적용하여 대중의 트렌드를 파악하는 등 다양하게 활용되고 있음. 1. Bag-of-Words Encoding of Text Documents - Bag-of-words vector 텍스트 데이터나 이미지 데이터는 비정형 데이터! 이를 정형 데이터(환자 정보인 나이,성별,몸무게 등이 테이블 형태로 되어있는 데이터)..
2021.11.20 -
NLP [DAY1]에서 NLP Intro와 Bag-of-Words강의까지 같이 있어서 분리해서 포스팅함. 1. Word Embedding - 벡터가 어떻게 의미를 가지게 되는가 구분 백워브워즈 가정 언어 모델 분포 가정 내용 어떤 단어가 (많이) 쓰였는가 단어가 어떤 순서로 쓰였는가 어떤 단어가 같이 쓰였는가 대표 통계량 TF-IDF - PMI 대표 모델 Deep Averaging Network ELMo, GPT Word2Vec 임베딩을 만드는 세 가지 철학 - 백오브워즈 가정 : 저자의 의도가 단어 사용 여부나 그 빈도에서 드러난다고 보는 가정. TF-IDF(Term Frequency-Inverse Document Frequency) : 어떤 단어의 주제 에측 능력이 강할수록 가중치가 커지고, 그 반대..
[DAY1] Bag-of-WordsNLP [DAY1]에서 NLP Intro와 Bag-of-Words강의까지 같이 있어서 분리해서 포스팅함. 1. Word Embedding - 벡터가 어떻게 의미를 가지게 되는가 구분 백워브워즈 가정 언어 모델 분포 가정 내용 어떤 단어가 (많이) 쓰였는가 단어가 어떤 순서로 쓰였는가 어떤 단어가 같이 쓰였는가 대표 통계량 TF-IDF - PMI 대표 모델 Deep Averaging Network ELMo, GPT Word2Vec 임베딩을 만드는 세 가지 철학 - 백오브워즈 가정 : 저자의 의도가 단어 사용 여부나 그 빈도에서 드러난다고 보는 가정. TF-IDF(Term Frequency-Inverse Document Frequency) : 어떤 단어의 주제 에측 능력이 강할수록 가중치가 커지고, 그 반대..
2021.11.19 -
NLP(Natural Language Processing) : 컴퓨터가 사람의 언어를 처리하는 것을 말함. NLP Apllications Text Classfication : ex. Spam Detection, Sentiment Analysis, ... Question Answering, Search Engine Machine Translation : ex. 파파고, 구글번역기 Chatbot : ex. 채널톡 Personal Assistant : ex. Siri Text Summarization Academic Disciplines related to NLP Major Conferences : ACL, EMNLP, NAACL 등의 학회 Low-level parsing Tokenization : 주어진 문..
[DAY 1] 자연어처리 IntroNLP(Natural Language Processing) : 컴퓨터가 사람의 언어를 처리하는 것을 말함. NLP Apllications Text Classfication : ex. Spam Detection, Sentiment Analysis, ... Question Answering, Search Engine Machine Translation : ex. 파파고, 구글번역기 Chatbot : ex. 채널톡 Personal Assistant : ex. Siri Text Summarization Academic Disciplines related to NLP Major Conferences : ACL, EMNLP, NAACL 등의 학회 Low-level parsing Tokenization : 주어진 문..
2021.11.19 -
책의 2부에서 처음으로 등장하는 구현에 대해 공부하는 시간이다. 1. 구현 - 구현 : 머릿속에 있는 알고리즘을 소스코드로 바꾸는 과정 - 특징 알고리즘은 간단한데 코드가 지나칠 만큼 길어지는 문제 특정 소수점 자리까지 출력해야하는 문제 문자열이 입력으로 주어졌을 때 한 문자 단위로 끊어서 리스트에 넣어야 하는(파싱을 해야하는) 문제 라이브러리 사용 경험이 많다면 유리(ex. 순열 문제의 경우 itertools로 쉽게 짜기 가능) 완전탐색 : 모든 경우의 수를 주저 없이 다 계산하는 해결 방법 시뮬레이션 : 문제에서 제시한 알고리즘을 한 단계씩 차례대로 직접 수행해야하는 문제 유형 - 메모리 제약 사항 고려하기!(with Python) 대체로 코딩 테스트에서는 128 ~ 512 MB로 메모리 제한 BUT..
[이것이 코딩테스트다] 아이디어를 코드로 바꾸는 구현책의 2부에서 처음으로 등장하는 구현에 대해 공부하는 시간이다. 1. 구현 - 구현 : 머릿속에 있는 알고리즘을 소스코드로 바꾸는 과정 - 특징 알고리즘은 간단한데 코드가 지나칠 만큼 길어지는 문제 특정 소수점 자리까지 출력해야하는 문제 문자열이 입력으로 주어졌을 때 한 문자 단위로 끊어서 리스트에 넣어야 하는(파싱을 해야하는) 문제 라이브러리 사용 경험이 많다면 유리(ex. 순열 문제의 경우 itertools로 쉽게 짜기 가능) 완전탐색 : 모든 경우의 수를 주저 없이 다 계산하는 해결 방법 시뮬레이션 : 문제에서 제시한 알고리즘을 한 단계씩 차례대로 직접 수행해야하는 문제 유형 - 메모리 제약 사항 고려하기!(with Python) 대체로 코딩 테스트에서는 128 ~ 512 MB로 메모리 제한 BUT..
2021.10.26 -
책의 2부에서 처음으로 등장하는 그리디 알고리즘에 대해 공부하는 시간이다. 1. 그리디 - 그리디(탐욕법) : 현재 상황에서 지금 당장 좋은 것만 고르는 방법 - 특징 사전에 외우고 있지 않아도 풀 수 있을 가능성이 높은 문제 유형 매우 다양 => 사전지식 없이도 풀 수 있지만 그만큼 다양한 문제들로 훈련해야함. 창의력과 문제를 풀기 위한 최소한의 아이디어를 떠올릴 수 있는 능력을 요구함. 정렬 알고리즘과 짝을 이뤄 출제가 됨. - 문제 파악법 단순히 현재 상황에서 가장 좋아 보이는 것만 선택해도 문제를 풀 수 있는가? "가장 큰 순서대로", "가장 작은 순서대로"와 같은 기준을 알게 모르게 제시하는가? 대체로 위와 같은 기준은 정렬과 연관이 있어 정렬 알고리즘과 짝을 이뤄 출제가 됨. 그리디 문제의 해..
[이것이 코딩테스트다] 당장 좋은 것만 선택하는 그리디책의 2부에서 처음으로 등장하는 그리디 알고리즘에 대해 공부하는 시간이다. 1. 그리디 - 그리디(탐욕법) : 현재 상황에서 지금 당장 좋은 것만 고르는 방법 - 특징 사전에 외우고 있지 않아도 풀 수 있을 가능성이 높은 문제 유형 매우 다양 => 사전지식 없이도 풀 수 있지만 그만큼 다양한 문제들로 훈련해야함. 창의력과 문제를 풀기 위한 최소한의 아이디어를 떠올릴 수 있는 능력을 요구함. 정렬 알고리즘과 짝을 이뤄 출제가 됨. - 문제 파악법 단순히 현재 상황에서 가장 좋아 보이는 것만 선택해도 문제를 풀 수 있는가? "가장 큰 순서대로", "가장 작은 순서대로"와 같은 기준을 알게 모르게 제시하는가? 대체로 위와 같은 기준은 정렬과 연관이 있어 정렬 알고리즘과 짝을 이뤄 출제가 됨. 그리디 문제의 해..
2021.10.22 -
6-7월 한창 K-Digital Training 교육을 받기위해 코딩테스트를 준비했었다. 네이버 부스트캠프 AI-Tech에서 최종에서 비록 탈락해서 구름에서 진행하는 자연어처리과정에 최종합격해서 자연어처리를 공부중이다. 교육을 시작한지 벌써 3개월차에 접어 들었다. 교육초기에 기술 블로그를 운영해보자는 마음에 1일 1포스팅을 마음먹었지만 얼마지나지 않아 흐지부지... 지금이라도 마음을 다잡고자 1일 1포스팅을 다시 해보려고 한다. 블로그에는 자연어처리에 관한 내용뿐만아니라 코딩테스트를 준비하는 것에 대한 내용도 정리해보려 한다. 그래서 오늘은 코딩테스트를 준비할 때 구매한 [이것이 코딩 테스트다]라는 책을 한 번 전체적으로 훑어보는 시간을 가져보려고 한다. 1. 책 활용 법 책 완독 -> 백준 온라인 저..
[이것이 코딩 테스트다] 이코테 숲을 보자!6-7월 한창 K-Digital Training 교육을 받기위해 코딩테스트를 준비했었다. 네이버 부스트캠프 AI-Tech에서 최종에서 비록 탈락해서 구름에서 진행하는 자연어처리과정에 최종합격해서 자연어처리를 공부중이다. 교육을 시작한지 벌써 3개월차에 접어 들었다. 교육초기에 기술 블로그를 운영해보자는 마음에 1일 1포스팅을 마음먹었지만 얼마지나지 않아 흐지부지... 지금이라도 마음을 다잡고자 1일 1포스팅을 다시 해보려고 한다. 블로그에는 자연어처리에 관한 내용뿐만아니라 코딩테스트를 준비하는 것에 대한 내용도 정리해보려 한다. 그래서 오늘은 코딩테스트를 준비할 때 구매한 [이것이 코딩 테스트다]라는 책을 한 번 전체적으로 훑어보는 시간을 가져보려고 한다. 1. 책 활용 법 책 완독 -> 백준 온라인 저..
2021.10.21