2022. 5. 23. 00:17ใ๐งช Data Science/ML, DL
Alternating Least Squares
์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ ์ค ํ๋๋ก, ๊ต๋ ์ต์ ์ ๊ณฑ๋ฒ์ด๋ผ๊ณ ๋ ๋ถ๋ฆฐ๋ค.
์ด๋ฒ ํฌ์คํ ์์ ๊ฐ๋จํ ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ ๊ฐ๋ ๋ค์ ์ดํด๋ณด๊ณ , ALS์ ์ฅ์ ์ ์์๋ณด์.
์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ
: ์ฌ์ฉ์๊ฐ ์ ํธํ ๋งํ ์์ดํ ์ ์ถ์ธกํจ์ผ๋ก์จ ์ฌ์ฉ์์๊ฒ ์ ํฉํ ํน์ ํญ๋ชฉ์ ์ถ์ฒํ๋ค.
์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์๋ ๋๊ฐ์ ๊ธฐ๋ณธ ์ถ์ด ์กด์ฌํ๋ค. ํ์ ํํฐ๋ง๊ณผ ์ฝํ ์ธ ํํฐ๋ง์ด๋ค.
(1) ํ์ ํํฐ๋ง(CF, Collaborative Filtering)
์ ์ -์์ดํ
์ํธ์์ฉ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ๋ค.
"์ด ์์์ ์ข๊ฒ ํ๊ฐํ ์ฌ๋๋ค์ ๋ ์ด๋ค ์์์ ์ข์ํ ๊น?"
์ฆ, ํน์ ์ ์ ์ ์ฑํฅ์ด ๋น์ทํ ์ฌ๋๋ค์ด ์ข๊ฒ ํ๊ฐํ ๊ฒ์ ์ถ์ฒํ๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ผ๊ณ ๋ณด๋ฉด ๋๋ค.
(2) ์ฝํ ์ธ ํํฐ๋ง(CB, Contents-Based-Filtering)
์ ์ ๋ฐ ์์ดํ ์ ํ ์คํธ ๋ฐ ์ด๋ฏธ์ง ์ ๋ณด๋ฅผ ํ์ฉํด์ ์ ์ฌํ ์ฝํ ์ธ ๋ฅผ ์ฐพ๋ ๊ธฐ์ ์ด๋ค. ์ฝํ ์ธ ๋ฅผ ๊ธฐ๋ณธ์ ์ผ๋ก ๋ถ์ํด์ ๋น์ทํ ์์ดํ ๋ผ๋ฆฌ ๊ทธ๋ฃนํํ๋ค.
"์์ด์ ์ '์ํ๋ก๊ทธ'๋ฅผ ์ข์ํ๋ ์ฌ๋์ ์์ด๋ค์ 'Tomboy'๋ฅผ ์ข์ํ ๊ฒ์ด๋ค"
์ฆ, ์์ดํ ์ ์ ์ฌ์ฑ์ ๋ฐํ์ผ๋ก ํน์ ์์ดํ ์ด ์ข์ ํ์ ๋ฐ์๋ค๋ฉด, ์ ์ฌํ ์์ดํ ์ ์ ์ ์๊ฒ ์ถ์ฒํ๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ค.
๋์ ์ํธ๋ณด์์ ์ด๋ค.
์์ดํ ์ ๋ํ ํ๊ฐ๊ฐ ์ ์ ๋(์ ์ -์์ดํ ์ํธ์์ฉ ๋นํ์ฑ)๋ ์ฝํ ์ธ ํํฐ๋ง์ ์ฐ๋ ๊ฒ์ด ์ ํฉํ๋ค. ํ์ง๋ง ์ ์ ๊ฐ ๋ง์์ง๊ณ ์ ์ -์์ดํ ์ํธ์์ฉ์ด ์ปค์ก์ ๋ CF๋ฅผ ๋ง์ด ์ฌ์ฉํ๋ค.
์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ์ ์ฐ์ด๋ ๋ฐ์ดํฐ๋ (1) Explicit FeedBack (2) Implicit FeedBack ๊ฐ ์๋ค. ์ฒซ ๋ฒ์งธ๋ ์ ์ ๋ค์ด ์ง์ ์ ์ผ๋ก ์์ดํ ์ ๋ํด ํ๊ฐ๋ฅผ ๋ด๋ฆฐ ๋ฐ์ดํฐ๋ค. ๋ ๋ฒ์งธ ์์ดํ ํด๋ฆญ ์ ๋ฑ ์ง์ ์ ์ธ ์ ํธ๋๋ ์๋ ๋ฐ์ดํฐ๋ค. ๋ณดํต ์ถ์ฒ ์๊ณ ๋ฆฌ์ฆ๋ค์ Explicit FeedBack ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ์ง๋ง, ALS๋ Implicit FeedBack ๋ฐ์ดํฐ๋ ์ฌ์ฉํด์ ์ถ์ฒํ ์ ์๋ค.
ALS, ๊ต๋ ์ต์ ์ ๊ณฑ๋ฒ
ALS๋ ํ์ ํํฐ๋ง ์๊ณ ๋ฆฌ์ฆ ์ค ํ๋์ด๋ค.
ํ์ ํํฐ๋ง ์๊ณ ๋ฆฌ์ฆ๋ ๋ฐฉ์์ ๋ฐ๋ผ ๋ ๊ฐ์ง๋ก ๋๋๋๋ฐ, (1) ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ์ ๊ทผ ๋ฐฉ์ (2) ๋ชจ๋ธ ๊ธฐ๋ฐ ์ ๊ทผ ๋ฐฉ์์ด ๊ทธ๊ฒ์ด๋ค. ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ์ ๊ทผ ๋ฐฉ์์ ์ ์ ์ฑํฅ ๋ฐ ์ ์ฌ๋๋ฅผ ๋ฉ๋ชจ๋ฆฌ์ ์ ์ฅํ ํ, ํน์ ์ ์ ์๊ฒ ์ถ์ฒํ๋ ๋ฐฉ์์ด๋ค. ํ์ง๋ง ALS๋ ๋ชจ๋ธ ๊ธฐ๋ฐ ์ ๊ทผ ๋ฐฉ์์ด๋ค.
๋ชจ๋ธ ๊ธฐ๋ฐ ์ ๊ทผ ๋ฐฉ์์ ๋ ๋ ๊ฐ์ง๋ก ๋๋๋ค.
(1) Latent Factor ๋ฐฉ์ : Matrix Factorization, ํ๋ ฌ ๋ถํด๋ฅผ ์ฌ์ฉ
(2) ๋ถ๋ฅ/ํ๊ท ๋ฐ ๋ฅ๋ฌ๋ ๋ฐฉ์ : ์ ๊ฒฝ๋ง ๋ฑ ๋จธ์ /๋ฅ๋ฌ๋ ์ฌ์ฉ
ALS์ ์ฅ์ ์ ๋ค์๊ณผ ๊ฐ๋ค.
(1) ๋ถ์ฐ์ฒ๋ฆฌ๊ฐ ๊ฐ๋ฅํ๋ค.
(2) ํ์ต ์๋๊ฐ ๋งค์ฐ ๋น ๋ฅด๋ค.
(3) Sparse ํ ๋ฐ์ดํฐ์๋ ๊ฐํ๋ค.
(4) Implicit ๋ฐ์ดํฐ๊ฐ Explicit ๋ฐ์ดํฐ๋ณด๋ค Sparseํ ์ฑํฅ์ด ๊ฐํ๋ค. ๋ฐ๋ผ์ Implicit ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์ถ์ฒ ๋ชจ๋ธ์ ๊ตฌ์ถํ๊ณ ์ ํ๋ค๋ฉด ALS๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ด ์ ๋ฆฌํ๋ค.
ALS์ ๊ฐ๋ ๊ณผ ์ฅ์ ๋ค์ ๊ฐ๋จํ๊ฒ ์์๋ณด์๋ค.
์์ ๋ฐ ์์ธํ ์๋ฆฌ๋ ๋์ด๊ฐ๊ณ ์ฝ๋ ํ์ฉ์ ๋จผ์ ํด๋ณด์.
ALS๋ Spark MLlib์์ ์ง์ํ๊ณ ์์ด์, Spark๋ฅผ ํตํด ์ค์ต์ ํด๋ณด์.
[์ค์ต]
** ๊ณ ๋ฏผ **
๋จธ์ /๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ค์ ๊ณต๋ถํ๋ฉด์ ์๋ก์ด ์์๊ณผ ์๋ฆฌ๋ฅผ ๋ง์ฃผํ ๋๊ฐ ์๋ค. ์ฒ์์ ๋ชจ๋ ์ดํดํ๋ ค ํ์ง๋ง, ๊ฐ์๋ก ํ์ด ๋ถ์น๋ค. ์ ์ด์ ์ํ์ ๊ณต๋ถํ์ง ์์์ ๊น์ด ํ๊ณ ๋ค๊ธฐ ์ด๋ ต๋ค๋ ํ๊ณ๊ฐ ์๋ค. ๋ฐ๋ผ์ ๊ฐ๋จํ ๊ฐ๋
๋ง ์ดํดํ๊ณ , ์ฝ๋๋ฅผ ๋จผ์ ์ดํผ๊ณ , ๋์ค์ ์ฌํํ๊ณ ์ถ์ ๋ ์์/์๋ฆฌ๋ฅผ ๋ ๊ณต๋ถํด๋ณด๊ธฐ๋ก ํ๋ค.
'๐งช Data Science > ML, DL' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๊ฐํํ์ต] REINFORCE ์๊ณ ๋ฆฌ์ฆ : ์ฝ๋ ๊ตฌํ (1) | 2024.06.02 |
---|---|
[๊ฐํํ์ต] REINFORCE ์๊ณ ๋ฆฌ์ฆ : ๊ฐ๋ ๋ฐ ์์ (0) | 2024.05.27 |
[ML] ์ฐจ์ ์ถ์ (1) - ์ ์, PCA, ์์ ์ฝ๋ (1) | 2024.02.26 |
[CNN basic] MNIST ๋ฐ์ดํฐ์ ํ์ต, ์์ธก (0) | 2022.04.19 |
[CNN basic] ํฉ์ฑ๊ณฑ ์ธต, ํ๋ง ์ธต (0) | 2022.04.19 |