๐งช Data Science(22)
-
[๊ฐํํ์ต] REINFORCE ์๊ณ ๋ฆฌ์ฆ : ๊ฐ๋ ๋ฐ ์์
๊ฐํํ์ต์ ๋ํด ๊ณต๋ถํ๊ณ ์์ด, ์ฌ๋ฌ ์๊ณ ๋ฆฌ์ฆ์ ์์๊ณผ ์ฝ๋๋ฅผ ์ ๋ฆฌํ๊ณ ์ ํ๋ค.์ด ํฌ์คํ ์ ์ฒซ ๋ฐ๊ฑธ์์ด๋ฉฐ, REINFORCE ์๊ณ ๋ฆฌ์ฆ์ ๋ํด ๋ค๋ฃจ๊ฒ ๋ค.ํ์ดํ ! ๋ณธ ํฌ์คํ ์ ์ฑ Foundation of Deep Reinforcement Learning / laura.G์์ ์์ ๋ฐ ๋ด์ฉ์ ์ฐธ๊ณ ํ์ฌ ์ฐ์ธ ๊ธ์ ๋๋ค. 1. REINFORCE ๊ฐ๋ 1.1. Model-free vs Model-Based ๊ฐํํ์ต์ ํฌ๊ฒ Model-free, Model-Based๋ก ๋๋๋ค. Model-Based ๊ฐํํ์ต์ trajectory๋ฅผ ์์ธกํ๋ ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ํ์ตํ๋ค. ๋ค์ํ ๊ฐ์ง์์ action์ ๋ํ ํ๋ฅ ๋์ trajectory๋ฅผ ์์ธกํ ์ ์๋๋ฐ, ์ด ๊ฒฝ์ฐ ๋ฌด์์๋ก sampling ๋ trajectory๋ฅผ..
2024.05.27 -
[ML] ์ฐจ์ ์ถ์ (1) - ์ ์, PCA, ์์ ์ฝ๋
ํฌ๊ฒ ์ ์๋ฏธํ์ง ์์ ์ ๋ณด๋ ๋ฒ๋ฆฌ๊ฑฐ๋ ๋ญ์ณ๋ผ. ์ด๋ฒ ๋ธ๋ก๊ทธ์์ ์ฐจ์ ์ถ์์ ๋ํด ๋ค๋ฃจ๊ณ ์ ํ๋ค. ์ ์ฐจ์์ ์ถ์ํด์ผ ํ๊ณ , ๊ตฌ์ฒด์ ์ผ๋ก ์ด๋ค ๋ฐฉ๋ฒ๊ณผ ์ํ์ ์๋ฆฌ๊ฐ ์กด์ฌํ๋์ง ์ดํด๋ณด์. 1) ์ฐจ์์ ์ ์ฃผ ์ฌ๊ธฐ ๋๋ฌผ์ ๋ถ๋ฅํด์ผ ํ๋ ๋ฌธ์ ๊ฐ ์๋ค. ๋๋ฌผ์ ํ๋ จ ์ํ์ด๋ผ ์ง์นญํ๊ณ , ๋๋ฌผ๋ค์ ํน์ฑ 500๊ฐ๊ฐ ์ฃผ์ด์ก๋ค๊ณ ํ๊ฒ ๋ค. ํน์ฑ๋ค์ ๋ฐํ์ผ๋ก ํ ๋ผ, ๊ณ ์์ด, ๊ฑฐ๋ถ์ด๋ฅผ ๋ถ๋ฅํด์ผ ํ๋ค. ํน์ฑ์ด ๋ง์์๋ก ์ ํํ ๋ถ๋ฅ๋ฅผ ํ ์ ์์ ๊ฒ ๊ฐ์ง๋ง, ์ค์์ ๊ทธ๋ ์ง ์๋ค. ๊ธฐํ๊ธ์์ ์ผ๋ก ๋์ด๋ ๊ณ์ฐ๋์ผ๋ก ์ธํด ๋ชจ๋ธ ํ๋ จ์ด ๋๋ ค์ง๊ณ , ์ข์ ์๋ฃจ์ ์ ์ฐพ๊ธฐ ํ๋ค์ด์ง๋ค. ๋ํ ๊ณผ๋์ ํฉ ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ ์๋ค. A, B ๊ฐ์ฒด๊ฐ 2๊ฐ์ ํน์ฑ์ ๊ฐ์ก์ ๋, ์๋์ ๊ฐ์ด ๊ทธ๋ํ๋ก ๋ํ๋ผ ์ ์๋ค. A์ B์ ๊ฑฐ๋ฆฌ๋ \[\sqrt{(5-2)^..
2024.02.26 -
[Analytics] ๋ฏธ๊ตญ ํ์๋ก ์์กดํ๋ ๋ฐฉ๋ฒ (2) feat. TLC
๋น์ ์ NEWYORK์์ ํ์ ๊ธฐ์ฌ๋ก ์ผํ๊ณ ์๋ค. ํ์๋ Yellow Taxi์ด๋ค. ํ์ ๊ธฐ์ฌ๋ก ์์กดํ๊ธฐ ์ํด์ ๋ค์๊ณผ ๊ฐ์ ๋ ธ๋ ฅ์ด ํ์ํ๋ค. 1) ๊ทผ๋ฌด ์๊ฐ ๋์, ์๋์ ์ต๋ํ ๋ง์ด ํ์ธ ๊ฒ (์๋) 2) ๋ง์ ์๊ธ + ํ๋ถํ ํ (์๊ธ) 3) ํ๊ธ ๊ฒฐ์ ๋ ์๋์ ํฌํจ์ํค์ง ์๊ณ ์ฌ์ฉํ๊ธฐ (์ธ๊ธ ์ ์ฝ) ์ฒซ ๋ฒ์งธ ๋ ธ๋ ฅ์ ์ด์ ํฌ์คํ ์์ ๋ค๋ค๋ค. ์ด๋ฒ ํฌ์คํ ์์ ๋ง์ ์๊ธ๊ณผ ํ์ ๋ฐ๋ ๋ฐฉ๋ฒ, ํ๊ธ ๊ฒฐ์ ํ๋ ์๋์ ๋ฐ๋ ๋ฐฉ๋ฒ์ ์์๋ณด๊ฒ ๋ค. [Data] ๋ฐ์ดํฐ๋ SparkSQL ํฌ์คํ ์์ ์ ์ฒ๋ฆฌํ Yellow Taxi ๋ฐ์ดํฐ(cleaned)๋ฅผ ์ฌ์ฉํ๋๋ก ํ๊ฒ ๋ค. NEWYORK Yellow Taxi์ ์ดํ์ 2021.01~2021.07๊น์ง ๋ชจ๋ ๋ชจ์๋์ ๋ฐ์ดํฐ๋ค. [Yellow Taxi Data: http..
2022.05.25 -
[์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ] ALS ๊ฐ๋ , Basic ํ๊ฒ feat. ์ฝ๋ X
Alternating Least Squares ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ ์ค ํ๋๋ก, ๊ต๋ ์ต์ ์ ๊ณฑ๋ฒ์ด๋ผ๊ณ ๋ ๋ถ๋ฆฐ๋ค. ์ด๋ฒ ํฌ์คํ ์์ ๊ฐ๋จํ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ ๊ฐ๋ ๋ค์ ์ดํด๋ณด๊ณ , ALS์ ์ฅ์ ์ ์์๋ณด์. ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ : ์ฌ์ฉ์๊ฐ ์ ํธํ ๋งํ ์์ดํ ์ ์ถ์ธกํจ์ผ๋ก์จ ์ฌ์ฉ์์๊ฒ ์ ํฉํ ํน์ ํญ๋ชฉ์ ์ถ์ฒํ๋ค. ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์๋ ๋๊ฐ์ ๊ธฐ๋ณธ ์ถ์ด ์กด์ฌํ๋ค. ํ์ ํํฐ๋ง๊ณผ ์ฝํ ์ธ ํํฐ๋ง์ด๋ค. (1) ํ์ ํํฐ๋ง(CF, Collaborative Filtering) ์ ์ -์์ดํ ์ํธ์์ฉ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ๋ค. "์ด ์์์ ์ข๊ฒ ํ๊ฐํ ์ฌ๋๋ค์ ๋ ์ด๋ค ์์์ ์ข์ํ ๊น?" ์ฆ, ํน์ ์ ์ ์ ์ฑํฅ์ด ๋น์ทํ ์ฌ๋๋ค์ด ์ข๊ฒ ํ๊ฐํ ๊ฒ์ ์ถ์ฒํ๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ผ๊ณ ๋ณด๋ฉด ๋๋ค. (2) ์ฝํ ์ธ ํํฐ๋ง(CB, Contents-Based-Filterin..
2022.05.23 -
[Analytics] ๋ฏธ๊ตญ ํ์๋ก ์์กดํ๋ ๋ฐฉ๋ฒ (1) feat. TLC
๋น์ ์ NEWYORK์์ ํ์ ๊ธฐ์ฌ๋ก ์ผํ๊ณ ์๋ค. ํ์๋ Yellow Taxi์ด๋ค. ํ์ ๊ธฐ์ฌ๋ก ์์กดํ๊ธฐ ์ํด์ ๋ค์๊ณผ ๊ฐ์ ๋ ธ๋ ฅ์ด ํ์ํ๋ค. 1) ๊ทผ๋ฌด ์๊ฐ ๋์, ์๋์ ์ต๋ํ ๋ง์ด ํ์ธ ๊ฒ (์๋) 2) ๋ง์ ์๊ธ + ํ๋ถํ ํ (์๊ธ) 3) ํ๊ธ ๊ฒฐ์ ๋ ์๋์ ํฌํจ์ํค์ง ์๊ณ ์ฌ์ฉํ๊ธฐ (์ธ๊ธ ์ ์ฝ) ๋ ๊ฐ์ง๋ ๋จ์ํ ๋ ธ๋ ฅ๋ง์ผ๋ก ์ด๋ค์ง์ง ์๋๋ค. ๋น ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด ์๋์ด ๋ง์ ์ฅ์์ ์๊ฐ์ ํน์ ํ๊ณ , ๋ฏธ๋ฆฌ ๋๊ธฐํ๊ณ ์์ด์ผ ํ๋ค. ๋ํ ์๋์ด ํน์ ์ฅ์๋ฅผ ์๊ตฌํด๋, ๊ทธ๊ณณ์ด ๋ฐ์ดํฐ ์ ์๋์ด ๋ง์ ์ฅ์๊ฐ ์๋๋ผ๋ฉด ์ฉ๊ธฐ ์๊ฒ Pass ํ ํ์๋ ์๋ค. ๊ทธ๋ ๋ค๋ฉด ์ง๊ธ๋ถํฐ ๋ฐ์ดํฐ๋ฅผ ์ดํด๋ณด๋ฉฐ ์ ๋ต์ ๊ตฌ์ถํด๋ณด์. [Data] ๋ฐ์ดํฐ๋ SparkSQL ํฌ์คํ ์์ ์ ์ฒ๋ฆฌํ Yellow Taxi ๋ฐ์ดํฐ(cleane..
2022.05.12 -
[CNN basic] MNIST ๋ฐ์ดํฐ์ ํ์ต, ์์ธก
์ด๋ฒ ํฌ์คํ ์์ ๊ฐ๋จํ๊ฒ Keras๋ฅผ ์ด์ฉํ์ฌ CNN๋ชจ๋ธ์ ๋ง๋ค๊ณ ํ์ต, ์์ธกํ๋ค. CNN์ ํ์ต๊ณผ์ ์ ์ ์ฒด์ ์ผ๋ก ๋ฐ๋ผ๊ฐ ๋ณด์. CNN์ ๊ฐ๋ ์ด ์ต์์ง ์๋ค๋ฉด ์ด์ ํฌ์คํ ์ ๋ณด๊ณ ์ค์. [์ด์ ํฌ์คํ : https://mengu.tistory.com/23] [CNN basic] ํฉ์ฑ๊ณฑ ์ธต, ํ๋ง ์ธต CNN basic ํฉ์ฑ๊ณฑ ์ธต, ํ๋ง ์ธต CNN(Convolutional neural network)์ด๋? ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง์ ์๊ฐ ํผ์ง ์์ ๋ด๋ฐ ์๋๋ฐฉ์์ ๋ณธ ๋ฐ ๋ง๋ค์ด์ง ๋คํธ์ํฌ์ด๋ค. ์ ๊ทธ๋ฆผ์ ์ค์ ์๊ฐํผ์ง์ ๋ด๋ฐ์ด ์๋ํ๋ ๋ฐฉ์์ด mengu.tistory.com MNIST ๋ฐ์ดํฐ์ MNIST ๋ฐ์ดํฐ์ ์ ์๊ธ์จ ๋ฐ์ดํฐ ์ ์ด๋ค. ํด๋น ํฌ์คํ ์์ , ์ด๋ฏธ์ง๋ฅผ ๋ฐํ์ผ๋ก ์๊ธ์จ๋ฅผ 0~10๊น์ง ๋ถ๋ฅํ๋ ๋ชจ๋ธ์ ๋ง๋ค ๊ฒ์ด..
2022.04.19