목록전체 글 (5)
co-LAB

5주차 : 실전 파이널 프로젝트 5주차 강의에서는 마케팅 분석 툴로써의 Python을 활용하여 데이터 전처리 / 추출 / 시각화 / 분석 등 데이터 분석 프로젝트를 실습해본다. ˙광고매체 데이터 : 광고매체에서 집행된 광고 성과를 보고서 형식으로 제공하는 데이터 - 광고 성과지표 : CTR (Click Through Rate) / CPM (Cost Per Mile) / CPC (Cost Per Click) / CPA (Cost Per Action) ˙고객 데이터 : 마케팅 활동으로 쌓이는 고객들의 여러가지 정보를 포함한 데이터 - 기업의 목표에 따라 나이, 직업, 결혼여부, 교육수준 등 다양한 데이터 유형이 존재 ˙데이터 분석 과정 : 데이터 수집 / 전처리 / 탐색(*시각화) / 모델 선택 / 모델 평..

4주차 : 데이터 시각화 & 분석 실전 4주차 강의에서는 matplotlib 베이스의 Python 데이터 시각화 라이브러리인 Seaborn을 활용한 데이터 시각화 기법을 학습하고, 공공 데이터를 활용하여 실습해본다. Seaborn : matplotlib을 기본으로 다양한 시각화 기법을 제공하는 라이브러리 - Pairplot, Boxplot, Violinplot, Facetgrid... 4주차 강의를 통해 그동안 학습한 Python, Pandas를 기반으로 데이터를 추출하고 다양한 기법으로 시각화할 수 있게 되었다. 낯설기만 했던 코드와 함수들이 꾸준히 반복하는 과정에서 익숙해졌다. 그리고 그 함수들이 어떤 것들을 보여주고, 어떤 일들을 해줄 수 있는지 알게되고 나니 더욱 친근하고 고맙게 느껴졌다. 엑셀로..

3주차 : Python Numpy & Pandas (Library) 3주차 강의에서는 Python 데이터 분석을 할 때 사용하는 라이브러리인 Numpy와 Pandas의 기본 사용법을 익힌다. Numpy array 생성과 연산 등 데이터 분석에 활용되는 기본 문법을 연습하고, Pandas의 기본 자료 구조인 DataFrame의 사용법과 활용 방법을 학습한다. 1. NumPy : Numerical Python의 약자 - 수학 및 과학 연산을 위한 Python 패키지로 수치해석, 통계 관련 기능 구현 시 기본 모듈. 2. Pandas : Python Data Analysis 의 약자 - 데이터 조작 및 분석을 위한 Python 프로그래밍 언어 용으로 작성된 소프트웨어 라이브러리. - 숫자 테이블과 시계열을 조..

Python 이란 ˙전 세계적으로 가장 많이 사용하는 프로그래밍 언어 중 하나. ˙1991년 Guido van Rossum이 개발하였다. ˙Zen of Python (PEP 20)* * Zen of Python : Python 프로그래밍 언어의 설계에 영향을 미치는 컴퓨터 프로그램 작성을 위한 19가지 원칙 가이드 1. Beautiful is better than ugly. 2. Explicit is better than implicit. 3. Simple is better than complex. 4. Complex is better than complicated. 5. Flat is better than nested. 6. Sparse is better than dense. 7. Readability..

빅데이터 분석 강의를 선택한 이유 급격하게 다양해지는 온라인 환경의 서비스에 따라 데이터 또한 다양해지고 그 표본 또한 많아졌다. 서비스를 기획하고 운영해야 하는 서비스 기획자의 입장에서, 서비스 사용자 특성에 따른 사용성 개선과 마케팅의 기반이 되는 데이터가 넘쳐나는 상황에서 데이터 리터러시(Data Literacy)*는 필수불가결한 역량이다. * 데이터 리터러시(Data Literacy) : 데이터 수집, 관리, 가공 및 분석, 데이터 시각화, 데이터 기획 등의 능력을 포함하는 데이터 해석 능력 업무를 진행하며 필요할 때마다 데이터를 수집하고 원하는 데이터를 추출하기 위해 다양한 방법을 적용해왔다. 본 강의를 통해 아래 두 가지를 가져가려고 한다. 1. Python을 활용한 데이터 분석 업무 효율화 ..