λ³Έλ¬Έ λ°”λ‘œκ°€κΈ°

전체 κΈ€33

ν•Έμ¦ˆμ˜¨ λ¨Έμ‹ λŸ¬λ‹ 7μž₯. 앙상블 Intro이번 κΈ€μ—μ„œ λ‹€λ£° λ‚΄μš©μ€ 앙상블 ν•™μŠ΅μ΄λ‹€μ–΄λ–€ ν•˜λ‚˜μ˜ λ³΅μž‘ν•œ μ§ˆλ¬Έμ— λŒ€ν•΄ μˆ˜λ§Žμ€ μ‚¬λžŒλ“€μ—κ²Œ 닡변을 λ“£κ³  λͺ¨μ•„ ν•˜λ‚˜μ˜ μ™„μ„±λœ 닡을 λ§Œλ“œλŠ” κ²ƒμ²˜λŸΌ μ—¬λŸ¬ 개의 λͺ¨λΈ μ˜ˆμΈ‘μ„ λͺ¨μ•„μ„œ 더 쒋은 μ˜ˆμΈ‘μ„ λ§Œλ“œλŠ” 방법을 앙상블이라 ν•œλ‹€μ΄μ „ μž₯μ—μ„œ 배운 κ²°μ • 트리λ₯Ό μˆ˜μ‹­, 수백개 λ¬Άμ–΄μ„œ ν•˜λ‚˜μ˜ κ±°λŒ€ν•œ λͺ¨λΈ μ§‘ν•©μœΌλ‘œ λ§Œλ“  랜덀 ν¬λ ˆμŠ€νŠΈλ„ μ‚΄νŽ΄λ³Ό κ²ƒμ΄λ‹€μ•™μƒλΈ”μ—λŠ” μ—¬λŸ¬ 개의 μ’…λ₯˜κ°€ μ‘΄μž¬ν•œλ‹€λ³΄νŒ…λ°°κΉ… & νŽ˜μ΄μŠ€νŒ…λžœλ€ 패치 & μ„œλΈŒμŠ€νŽ˜μ΄μŠ€λΆ€μŠ€νŒ…μŠ€νƒœν‚Ή μ΄λ²ˆ λ‚΄μš©μ—μ„œλŠ” μ•™μƒλΈ”μ—λŠ” μ–΄λ–€ μ’…λ₯˜κ°€ 있고 각 방법에 λŒ€ν•΄ μ‚΄νŽ΄λ³΄λ„λ‘ ν•˜κ² λ‹€  μ™œ μ—¬λŸ¬ 개의 λͺ¨λΈμ„ 앙상블 ν–ˆμ„ λ•Œ κ°œλ³„ λͺ¨λΈλ³΄λ‹€ 더 μ„±λŠ₯이 μ’‹μ„κΉŒ??본격적으둜 앙상블을 μ‚΄νŽ΄λ³΄κΈ° 전에 이 점에 λŒ€ν•΄ κ°„λ‹¨ν•˜κ²Œ 짚고 λ„˜μ–΄κ°€κ³ μž ν•œλ‹€ 1. 큰 수의 법칙과 앙상블앙상블을 μ‹€μ œλ‘œ μ‚¬μš©ν•΄.. 2024. 10. 11.
ν•Έμ¦ˆμ˜¨ λ¨Έμ‹ λŸ¬λ‹ 6μž₯. κ²°μ • 트리 Introκ²°μ • νŠΈλ¦¬λŠ” λΆ„λ₯˜μ™€ νšŒκ·€μ— 두루두루 쓰이며 맀우 λ³΅μž‘ν•œ 데이터셋도 ν•™μŠ΅ν•  수 μžˆλŠ” μ„±λŠ₯이 λ›°μ–΄λ‚œ μ•Œκ³ λ¦¬μ¦˜μ΄λ‹€λ˜ν•œ, ν˜„μž¬λ„ 자주 μ‚¬μš©λ˜λŠ” 쒋은 μ•Œκ³ λ¦¬μ¦˜μΈ 랜덀 포레슀트의 κΈ°λ³Έ ꡬ성 μš”μ†Œμ΄κΈ°λ„ ν•˜λ‹€μ΄λ²ˆ μ±•ν„°μ—μ„œλŠ” κ²°μ • 트리의 ν›ˆλ ¨, μ‹œκ°ν™”, 예츑 방법을 μ‚΄νŽ΄λ³΄κ³  νŠΈλ¦¬μ— 규제λ₯Ό μ£ΌλŠ” 법, νšŒκ·€ λ¬Έμ œμ— μ μš©ν•˜λŠ” 방법 등을 λ³Ό 것이닀  1. κ²°μ • 트리 κΈ°λ³Έ κ°œλ… 및 μ‹œκ°ν™” 1-1. κ²°μ • 트리 μ‹œκ°ν™”   μœ„μ˜ 사진은 κ²°μ • 트리의 κ°œλ…μ„ κ°„λ‹¨ν•˜κ²Œ ν‘œν˜„ν•œ κ·Έλž˜ν”„μ΄λ‹€κ²°μ • 트리λ₯Ό μ„€λͺ…ν•  λ•Œ, μŠ€λ¬΄κ³ κ°œμ— 많이 λΉ„κ΅ν•œλ‹€. μž…λ ₯된 ν•˜λ‚˜μ˜ 데이터가 μ–΄λ–€ 정닡을 κ°€μ§€κ³  μžˆλŠ”μ§€ μ—¬λŸ¬ 개의 μ§ˆλ¬Έμ„ 던져 예/μ•„λ‹ˆμ˜€λ₯Ό λ°˜λ³΅ν•˜λ©΄μ„œ ν•™μŠ΅ 및 μ˜ˆμΈ‘ν•˜λŠ” κ²ƒμ΄λ‹€κ·Έλ¦Όμ˜ μ˜ˆμ‹œλ₯Ό 보자면 λ§€, νŽ­κ·„, 돌고래, κ³° 4개의 동물을 3개의 μ§ˆλ¬Έμ„ 톡.. 2024. 9. 23.
ν•Έμ¦ˆμ˜¨ λ¨Έμ‹ λŸ¬λ‹ 5μž₯. μ„œν¬νŠΈ 벑터 λ¨Έμ‹  Intro μ„œν¬νŠΈ 벑터 λ¨Έμ‹ (Support Vector Machine, SVM). μ„ ν˜•/λΉ„μ„ ν˜• λΆ„λ₯˜, νšŒκ·€, 특이치 탐지에 μ‚¬μš©ν•  수 μžˆλŠ” λ‹€λͺ©μ  λ¨Έμ‹ λŸ¬λ‹ λͺ¨λΈμ€‘μ†Œκ·œλͺ¨μ˜ λΉ„μ„ ν˜• 데이터셋(수백 ~ 수천 개의 μƒ˜ν”Œ), 특히 λΆ„λ₯˜μ—μ„œ 쒋은 μ„±λŠ₯을 λ³΄μ—¬μ€€λ‹€μ΄λ²ˆ μž₯μ—μ„œλŠ” SVM의 핡심 κ°œλ…κ³Ό μ‚¬μš©λ²•, μž‘λ™ 원리λ₯Ό κ°€λ³κ²Œ μ‚΄νŽ΄λ³Ό κ²ƒμ΄λ‹€μ²˜μŒ 이 책을 λ³Έλ‹€λ©΄ μˆ˜ν•™μ μΈ 뢀뢄듀이 μ–΄λ ΅κ³  이해가 μ•ˆλ˜μ„œ 큰 μž₯벽으둜 λŠκ»΄μ§ˆν…λ° μˆ˜μ‹μ„ μ™„μ „νžˆ μ΄ν•΄ν•˜κΈ° 보단 SVMμ—λŠ” 이런 μˆ˜μ‹μ΄ μ–΄λ–»κ²Œ μž‘λ™ν•œλ‹€ - μ •λ„λ‘œ μ΄ν•΄ν•˜λŠ” 정도면 μΆ©λΆ„ν•˜λ‹€      1. μ„ ν˜• SVM λΆ„λ₯˜SVM의 κΈ°λ³Έ μ•„μ΄λ””μ–΄λŠ” 그림으둜 μ΄ν•΄ν•˜κΈ°κ°€ κ°€μž₯ μ’‹λ‹€. 예제 λ°μ΄ν„°λ‘œλŠ” Iris 데이터λ₯Ό μ‚¬μš©ν•œλ‹€μ΄ κ·Έλž˜ν”„λŠ” Setosa와 VersicolorλΌλŠ” 2κ°€μ§€ μ’…λ₯˜μ— λŒ€ν•΄ .. 2024. 9. 11.
ν•Έμ¦ˆμ˜¨ λ¨Έμ‹ λŸ¬λ‹ 4μž₯. λͺ¨λΈ ν›ˆλ ¨ λͺ¨λΈμ˜ λ‚΄λΆ€λŠ” λΈ”λž™λ°•μŠ€μ™€ κ°™λ‹€. λͺ¨λΈ μ•ˆμ—μ„œ μ–΄λ–€ 과정듀이 μ΄λ£¨μ–΄μ§€λŠ”μ§€ λͺ¨λ₯Έ 채 2,3μž₯μ—μ„œ λͺ¨λΈμ„ μ‚¬μš©ν•΄μ™”λ‹€λ‹¨μˆœνžˆ λͺ¨λΈλ§Œ μ‚¬μš©ν•œλ‹€λ©΄ λͺ¨λΈ λ‚΄λΆ€μ˜ μžμ„Έν•œ ꡬ쑰듀과 μ—°μ‚° 과정듀을 μžμ„Έν•˜κ²Œ μ•Œ ν•„μš”λŠ” μ—†λ‹€.ν•˜μ§€λ§Œ μ–΄λ–»κ²Œ μž‘λ™ν•˜λŠ”μ§€ 잘 μ΄ν•΄ν•œλ‹€λ©΄ μ μ ˆν•œ λͺ¨λΈ 및 ν›ˆλ ¨ μ•Œκ³ λ¦¬μ¦˜ 선택, λͺ¨λΈ νŠœλ‹ λ“± λͺ¨λΈ κ°œμ„ μ— 더 μ ν•©ν•œ μž‘μ—…λ“€μ„ ν•  수 μžˆμ„ 것이닀λͺ¨λΈ ν›ˆλ ¨ 과정을 μ΄ν•΄ν•˜κΈ° μœ„ν•΄μ„œ κ°„λ‹¨ν•œ λͺ¨λΈμΈ μ„ ν˜• νšŒκ·€λΆ€ν„° μ‹œμž‘ν•œλ‹€. λͺ¨λΈμ˜ νŒŒλΌλ―Έν„°λ₯Ό μ°ΎλŠ” λ°©λ²•μ—λŠ” 2κ°€μ§€κ°€ μžˆλ‹€ν›ˆλ ¨ μ„ΈνŠΈμ— κ°€μž₯ 잘 λ§žλŠ” λͺ¨λΈ νŒŒλΌλ―Έν„°λ₯Ό 직접 계산경사 ν•˜κ°•λ²•μ΄λΌλŠ” 반볡적인 μ΅œμ ν™” 방식을 μ‚¬μš©ν•˜μ—¬ λͺ¨λΈ νŒŒλΌλ―Έν„°λ₯Ό μ‘°μ •λ°°μΉ˜ 경사 ν•˜κ°•λ²•, λ―Έλ‹ˆ 배치 경사 ν•˜κ°•λ²•, ν™•λ₯ μ  경사 ν•˜κ°•λ²• 3κ°€μ§€ μ’…λ₯˜κ°€ μ‘΄μž¬ν•œλ‹€μ„ ν˜• νšŒκ·€μ—μ„œ 경사 ν•˜κ°•λ²•μ΄λΌλŠ” 방법을 톡해.. 2024. 8. 24.
ν•Έμ¦ˆμ˜¨ λ¨Έμ‹ λŸ¬λ‹ 3μž₯. λΆ„λ₯˜ 2μž₯μ—μ„œ μΊ˜λ¦¬ν¬λ‹ˆμ•„ 주택 가격을 μ˜ˆμΈ‘ν•˜λŠ” λͺ¨λΈμ„ λ§Œλ“œλŠ” 전체 과정을 λ‹€λ€˜λ‹€λ©΄ 이번 μž₯μ—μ„œλŠ” λΆ„λ₯˜μ— λŒ€ν•΄μ„œ λ‹€λ£° 것이닀.λͺ©μ°¨λŠ” λ‹€μŒκ³Ό κ°™λ‹€.  λ°μ΄ν„°μ…‹ 듀여닀보기이진 λΆ„λ₯˜κΈ° ν…ŒμŠ€νŠΈλΆ„λ₯˜ μ„±λŠ₯ 츑정닀쀑 λΆ„λ₯˜μ˜€λ₯˜ 뢄석닀쀑 λ ˆμ΄λΈ” λΆ„λ₯˜λ‹€μ€‘ 좜λ ₯ λΆ„λ₯˜  1. 데이터셋 듀여닀보기  2μž₯μ—μ„œλŠ” 값을 μ˜ˆμΈ‘ν•˜λŠ” νšŒκ·€λ₯Ό λ‹€λ€˜κ³  이번 μž₯μ—μ„œλŠ” 클래슀λ₯Ό λ‚˜λˆ„κ³  μ˜ˆμΈ‘ν•˜λŠ” λΆ„λ₯˜μ— λŒ€ν•΄ μ•Œμ•„λ³Ό κ²ƒμ΄λ‹€μ—¬κΈ°μ„œλŠ” MNISTλΌλŠ” 숫자 손글씨 이미지λ₯Ό 닀뀄보겠닀. 이 데이터셋은 κ°„λ‹¨ν•œ 토이 ν”„λ‘œμ νŠΈλ‚˜ κ³΅λΆ€ν•˜κΈ°μ— 자주 μ‚¬μš©λ˜λŠ” 데이터셋이며 0μ—μ„œ 9κΉŒμ§€ 10개의 μˆ«μžλ“€μ΄ μ†κΈ€μ”¨λ‘œ 써진 이미지λ₯Ό κ°€μ§€κ³  μžˆλ‹€  λ°μ΄ν„°μ˜ ν˜•νƒœλŠ” X.shape, y.shape ⇒ ((70000, 784), (70000,)) 이며 28x28 ν”½μ…€μ˜ 이미지듀이 784 .. 2024. 8. 18.
ν•Έμ¦ˆμ˜¨ λ¨Έμ‹ λŸ¬λ‹ 2μž₯. λ¨Έμ‹ λŸ¬λ‹ ν”„λ‘œμ νŠΈ μ²˜μŒλΆ€ν„° λκΉŒμ§€ μΉœκ΅¬λ“€κ³Ό 같이 μ§„ν–‰ν•˜λŠ” μŠ€ν„°λ””μ—μ„œ 격주둜 ν•Έμ¦ˆμ˜¨ λ¨Έμ‹ λŸ¬λ‹ ν•œ 챕터씩 κ³΅λΆ€ν•˜κ³  λ°œν‘œλ₯Ό ν•˜κ³  μžˆλ‹€.이 글은 λ°œν‘œλ₯Ό μœ„ν•΄ μ€€λΉ„ν•œ λŒ€λ³Έμ„ μ •λ¦¬ν•΄μ„œ 올린 κΈ€λ‘œ, μž…λ¬Έμž λ˜λŠ” μ΄ˆκΈ‰μžκ°€ λ³΄λŠ” 것을 κ°€μ •ν•˜κ³  μ λŠ”λ‹€.   λͺ©μ°¨λŠ” λ‹€μŒκ³Ό κ°™λ‹€. μΊ˜λ¦¬ν¬λ‹ˆμ•„ 주택 κ°€κ²©μ΄λΌλŠ” κ°„λ‹¨ν•œ ν”„λ‘œμ νŠΈλ₯Ό μ²˜μŒλΆ€ν„° λκΉŒμ§€ μ§„ν–‰ν•˜λ©΄μ„œ 각 ν”„λ‘œμ„ΈμŠ€λ³„λ‘œ μ–΄λ–€ 과정을 κ±°μ³μ•Όν•˜λŠ”μ§€, μ „λ°˜μ μœΌλ‘œ μ•Œμ•„λ³΄κ² λ‹€. λ¬Έμ œ μ •μ˜ 및 κ°€μ„€ 섀정데이터 뢄석데이터 μ „μ²˜λ¦¬λͺ¨λΈ 선택 및 ν•™μŠ΅λͺ¨λΈ νŠœλ‹ 및 고도화둠칭, λͺ¨λ‹ˆν„°λ§κ³Ό μœ μ§€λ³΄μˆ˜ 1. 문제 μ •μ˜ 및 κ°€μ„€ μ„€μ • 1.1 큰 κ·Έλ¦Ό 보기 2μž₯의 전체적인 ν”„λ‘œμ„ΈμŠ€λ₯Ό 잘 λ‚˜νƒ€λ‚΄μ€€ 이미지λ₯Ό λ°œκ²¬ν•˜μ—¬ κ°€μ Έμ™”λ‹€. 이미지 μΆœμ²˜λŠ” 맨 λ°‘.각 ν”„λ‘œμ„ΈμŠ€λ“€μ„ κ°„λ‹¨νžˆ 짚고 λ„˜μ–΄κ°€μžλ©΄λ¬Έμ œ μ •μ˜. 집값을 μ˜ˆμΈ‘ν•  것인지 μ•„λ‹ˆλ©΄ 고양이와 κ°•μ•„μ§€λ₯Ό.. 2024. 8. 11.