๋ณด๋์ค ์ฑ๋ฆฐ์ง
์ฑ๋ฆฐ์ง I: ๊ณ ๊ธ ์ํํธ๋งฅ์ค ๊ตฌํ
์ด ์ฑ๋ฆฐ์ง๋ Puzzle 18: ์ํํธ๋งฅ์ค Op์ ํ์ฅ์ ๋๋ค
์ํํธ๋งฅ์ค ๊ตฌํ์ ํ์ฅํ๋ ๊ณ ๊ธ ์ฑ๋ฆฐ์ง๋ค์ ๋๋ค:
1. ๋๊ท๋ชจ ์ํํธ๋งฅ์ค: TPB < SIZE ์ฒ๋ฆฌ
์
๋ ฅ ํฌ๊ธฐ๊ฐ ๋ธ๋ก๋น ์ค๋ ๋ ์๋ฅผ ์ด๊ณผํ๋ฉด(TPB < SIZE), ๋จ์ผ ๋ธ๋ก์ด ์ ์ฒด ๋ฐฐ์ด์ ์ฒ๋ฆฌํ ์ ์์ด ํ์ฌ ๊ตฌํ์ด ๋์ํ์ง ์์ต๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๋ ๋ ๊ฐ์ง ์ ๊ทผ๋ฒ์ด ์์ต๋๋ค:
1.1 ๋ฒํผ ๋ฆฌ๋์
- ๋ธ๋ก ๋จ์ ๊ฒฐ๊ณผ(์ต๋๊ฐ๊ณผ ํฉ๊ณ)๋ฅผ ๋๋ฐ์ด์ค ๋ฉ๋ชจ๋ฆฌ์ ์ ์ฅํฉ๋๋ค
- ๋ ๋ฒ์งธ ์ปค๋์ ์ฌ์ฉํ์ฌ ์ด ์ค๊ฐ ๊ฒฐ๊ณผ๋ค์ ๋ํด ๋ฆฌ๋์ ์ ์ํํฉ๋๋ค
- ์ ์ญ ์ต๋๊ฐ๊ณผ ํฉ๊ณ๋ฅผ ์ฌ์ฉํ๋ ์ต์ข ์ ๊ทํ ๋จ๊ณ๋ฅผ ๊ตฌํํฉ๋๋ค
1.2 2๋จ๊ณ ์ํํธ๋งฅ์ค
- 1์ฐจ: ๊ฐ ๋ธ๋ก์ด ๋ก์ปฌ ์ต๋๊ฐ์ ๊ณ์ฐํฉ๋๋ค
- ๋๊ธฐํ ํ ์ ์ญ ์ต๋๊ฐ์ ๊ณ์ฐํฉ๋๋ค
- 2์ฐจ: \(e^{x-max}\)์ ๋ก์ปฌ ํฉ๊ณ๋ฅผ ๊ณ์ฐํฉ๋๋ค
- ๋๊ธฐํ ํ ์ ์ญ ํฉ๊ณ๋ฅผ ๊ณ์ฐํฉ๋๋ค
- ์ต์ข : ์ ์ญ ํฉ๊ณ๋ฅผ ์ฌ์ฉํ์ฌ ์ ๊ทํํฉ๋๋ค
2. ๋ฐฐ์น ์ํํธ๋งฅ์ค
๋ฒกํฐ ๋ฐฐ์น(2D ์ ๋ ฅ ํ ์)์ ๋ํ ์ํํธ๋งฅ์ค๋ฅผ ๋ค์ ๋ณํ์ผ๋ก ๊ตฌํํฉ๋๋ค:
- ํ ๋จ์ ์ํํธ๋งฅ์ค: ๊ฐ ํ์ ๋ ๋ฆฝ์ ์ผ๋ก ์ํํธ๋งฅ์ค๋ฅผ ์ ์ฉํฉ๋๋ค
- ์ด ๋จ์ ์ํํธ๋งฅ์ค: ๊ฐ ์ด์ ๋ ๋ฆฝ์ ์ผ๋ก ์ํํธ๋งฅ์ค๋ฅผ ์ ์ฉํฉ๋๋ค
- ๋ ๊ตฌํ ๊ฐ์ ์ฑ๋ฅ ์ฐจ์ด๋ฅผ ๋น๊ตํฉ๋๋ค
์ฑ๋ฆฐ์ง II: ๊ณ ๊ธ ์ดํ ์ ๋ฉ์ปค๋์ฆ
์ด ์ฑ๋ฆฐ์ง๋ Puzzle 19: ์ดํ ์ Op์ ํ์ฅ์ ๋๋ค
๋ฒกํฐ ์ดํ ์ ๊ตฌํ์ ๊ธฐ๋ฐ์ผ๋ก, ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ํ๊ณ๋ฅผ ๋ํ๋ณด๋ ๊ณ ๊ธ ์ฑ๋ฆฐ์ง๋ค์ ๋๋ค:
1. ๋ ๊ธด ์ํ์ค ๊ธธ์ด
๊ธฐ์กด ์ปค๋์ ์ฌ์ฉํ์ฌ ๋ ๊ธด ์ํ์ค๋ฅผ ์ฒ๋ฆฌํ๋๋ก ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ํ์ฅํฉ๋๋ค:
1.1 ์ํ์ค ๊ธธ์ด ํ์ฅ
SEQ_LEN = 32์SEQ_LEN = 64๋ฅผ ์ฒ๋ฆฌํ๋๋ก ์ดํ ์ ๊ตฌํ์ ์์ ํฉ๋๋คTPB(๋ธ๋ก๋น ์ค๋ ๋ ์) ํ๋ผ๋ฏธํฐ๋ฅผ ๊ทธ์ ๋ง๊ฒ ์ ๋ฐ์ดํธํฉ๋๋ค- ์ ์น ์ปค๋์ด ๋ ํฐ ํ๋ ฌ ํฌ๊ธฐ๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ์ฒ๋ฆฌํ๋์ง ํ์ธํฉ๋๋ค
1.2 ๋์ ์ํ์ค ๊ธธ์ด
- ๋ฐํ์์ ๊ฐ๋ณ ์ํ์ค ๊ธธ์ด๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ ์ดํ ์ ์ ๊ตฌํํฉ๋๋ค
SEQ_LEN๋ณด๋ค ์งง์ ์ํ์ค๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํด ์ปค๋์ ๊ฒฝ๊ณ ๊ฒ์ฌ๋ฅผ ์ถ๊ฐํฉ๋๋ค- ๊ณ ์ ์ํ์ค ๊ธธ์ด ์ฒ๋ฆฌ์ ๋์ ์ํ์ค ๊ธธ์ด ์ฒ๋ฆฌ์ ์ฑ๋ฅ์ ๋น๊ตํฉ๋๋ค
2. ๋ฐฐ์น ๋ฒกํฐ ์ดํ ์
์ฌ๋ฌ ์ดํ ์ ์ฐ์ฐ์ ๋์์ ์ฒ๋ฆฌํ๋๋ก ํ์ฅํฉ๋๋ค:
2.1 ๋ฐฐ์น ์ฒ๋ฆฌ
- ์ฌ๋ฌ ์ฟผ๋ฆฌ ๋ฒกํฐ๋ฅผ ํ ๋ฒ์ ์ฒ๋ฆฌํ๋๋ก ์ดํ ์ ์ฐ์ฐ์ ์์ ํฉ๋๋ค
- ์ ๋ ฅ ํํ: Q(batch_size, d), K(seq_len, d), V(seq_len, d)
- ์ถ๋ ฅ ํํ: (batch_size, d)
- ์ ์ ํ ์ธ๋ฑ์ฑ์ผ๋ก ๊ธฐ์กด ์ปค๋์ ์ฌ์ฌ์ฉํฉ๋๋ค
2.2 ๋ฐฐ์น๋ฅผ ์ํ ๋ฉ๋ชจ๋ฆฌ ์ต์ ํ
- ๋ฐฐ์น ์์ ๊ฐ ๋ฒํผ๋ฅผ ์ฌ์ฌ์ฉํ์ฌ ๋ฉ๋ชจ๋ฆฌ ํ ๋น์ ์ต์ํํฉ๋๋ค
- ๋ค์ํ ๋ฐฐ์น ํฌ๊ธฐ(2, 4, 8)์์ ์ฑ๋ฅ์ ๋น๊ตํฉ๋๋ค
- ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ ํจํด์ ๋ถ์ํฉ๋๋ค