데이터로 Deep Dive

데이터 분석과 개발 경험을 공유합니다.

TOSSBANK 2

분류 알고리즘 - 결정 트리

알고리즘을 배운다는 것은?결정 트리 알고리즘스무고개를 하듯이 계속적인 질문을 통해 패턴을 찾아간다. 목적: 가장 효율적인 분류가 되기 위한 규칙을 찾음(모든 리프를 균일하게 만드는 것)정보 균일도 측정 방법정보 이득 vs 지니 계수 - 정보 이득: 엔트로피(복잡도) 개념 기반상이한 값들이 섞여 있으면 엔트로피 높음, 동일한 값들이 섞여 있으면 엔트로피 낮음정보 이득 지수 = 1 - 엔트로피 지수결정 트리는 이 정보 이득 지수로 분할 기준을 정한다. 즉, 정보 이득이 높은 속성을 기준으로 분할한다.  - 지니 계수: 경제학에서 불평등 지수를 나타낼 때 사용하는 지수0(평등/균일) ~ 1(불평등/불균일): 낮으면 낮을 수록 좋음!즉, 결정 트리에선 지니 계수를 0으로 만드는 것이 목적임  규칙 노드 생성 ..

한국경제신문 with toss bank 대망의 첫 날, OT 및 첫 수업 후기(feat. 국비지원 부트캠프 지원 계기)

진짜...고심 끝에 시작하게 된 국비지원 부트캠프한국경제신문과 토스뱅크가 함께하는 K-Digital Training의 'Tech 우수인재 양성을 위한 MLOps / Full stack 과정'이다.  참고로, 해당 교육을 포함해 총 3개 부트캠프에 지원했었는데 이 외에도 국비지원 부트캠프가 올해 정말로..많이 열리는 추세다. 고용노동부 보도자료를 보면 그 규모가 어느 정도인지 대략적으로 알 수 있음..! 고용노동부제목 “K-디지털 트레이닝”을 통해 첨단분야 등 고품질 훈련을 받는다 등록일 2024-04-05  조회 1,251  - 2024년 K-디지털 트레이닝 훈련과정 1차 공모 결과 126개 기관 210개 과정 선정 - 고용노동부(장www.moel.go.kr(*우측의 링크 붙임4에서 '24년 상반기 훈..

etc 2024.06.25