ย
When : 2023.07.07~2023.08.25
Where : Offline
Who : 29 people and 4 members (JS.Kwon, SY.Choi, SB.Choi, YJ.Han)
What : A-Z about AI study
Difficulty : ๐ฅ๐ฅ๐ฅ๐ฅ๐ฅ
๊ด๋ จ ๋งํฌ ์ฒจ๋ถ
https://newtradecampus.kita.net/page/user_job_AI_details
https://www.youtube.com/watch?v=e_7KcXoqalY&t=698s
2023๋
6์ 18์ผ ์ ์ฒญํ์ฌ ๋๋ฉด ๋ฉด์ ์งํ ํ,
์ฌ๋ฆ ๋ฐฉํ ๋์ ์คํ๋ผ์ธ์ผ๋ก ํ๋ํ ํ๋ก๊ทธ๋จ์
๋๋ค.
์ฌํ 3๋ ์ฐจ ์ด์์ด๊ณ , ์ผ์ ์์ค ์ด์์ ์์ด ์ ์๊ฐ ์ง์ ์๊ฒฉ์ด์์ต๋๋ค.
ํฌํญ๊ณต๋ ์ธ๊ณต์ง๋ฅ์ฐ๊ตฌ์์ ์ธํด์ญ ์ง์ ๊ธฐํ๊ฐ ์ ๊ณต๋์ต๋๋ค.
SK ๋์ค์ปค๋ฒ๋ฆฌ์ ์ธํด ๊ธฐํ๋ ์์๋๋ฐ ์์ด์ก์ต๋๋ค.
๊ต์ก ๋ด์ฉ์ 4์ฃผ ๊ฐ์ AI๊ธฐ์ ๊ณผ, 3์ฃผ ๊ฐ์ AI๋น์ฆ๋์ค ์ ๋ต ๊ธฐํ์ผ๋ก ๋๋ ์ก์ต๋๋ค.
AI ๊ธฐ์ ๊ต์ก ๋ด์ฉ์ผ๋ก๋,
ํ์ด์ฌ ๊ธฐ์ด, ๋ฐ์ดํฐ ๋ถ์, ์๊ณ ๋ฆฌ์ฆ, AI ๋ฆฌํฐ๋ฌ์, ๋จธ์ ๋ฌ๋, ๋ฅ๋ฌ๋, ์ธ์ด ์ธ๊ณต์ง๋ฅ, AI ํ๋ก์ ํธ๊ฐ ์์์ต๋๋ค.
AI ๊ธฐ์ ๊ต์ก ๊ธฐ๊ฐ์๋ ์~๊ธ, 10์๋ถํฐ 5์๊น์ง ๊ต์ก์ด ์งํ๋์ต๋๋ค.
ํ๊ท 12๋ช
์ ๋์ ์ธ์์ด ์์
์ดํ ์๋ฅํ์ฌ ๊ฐ์ธ์ ์ผ๋ก ๋ณต์ต์ ํ์ต๋๋ค.
5๋ช
์ ๋์ ์ค~์ ๊ณต์๋ค์ด ๊ฐ ํ์ ํ๋ช
์ฉ ๋ถ์ฐ๋์ด ํ์ด ์ด๋ค์ก์ต๋๋ค.
๋น์ ๊ณต์ ๊ต์ก์๋ค์ด ํด๋น ๊ต์ก์ ๊ต์ฅํ ์ด๋ ค์์ ๋ง์ด ๊ฒช์์ต๋๋ค.
์กฐ๊ธ ๊ณผ์ฅํ์๋ฉด, ํ ํ๊ธฐ ์ธ๊ณต์ง๋ฅ ๊ณผ์ ์ 3์ผ๋ก ์์ถํ์ต๋๋ค.
์์ถ๋ 5๊ฐ์ ์ธ๊ณต์ง๋ฅ์ ๋ํ ์ด๋ก ๊ณผ ๊ธฐ์ ์ ์ธ ๋ด์ฉ์ 3์ฃผ ๋ง์ ์ํํ๊ณ
๋จ์ 1์ฃผ๋ NLP ์์
์ ๋ค์ผ๋ฉด์ ํ๋ก์ ํธ๊น์ง ์งํํ๋
์ ๋ง ์
๋
ํ ์ปค๋ฆฌํ๋ผ์ด ์๋ ์ ์์ต๋๋ค.
๊ฐ์ธ์ ์ผ๋ก, โ์ด๊ฑธ ๋น์ ๊ณต์๋ค์ด ๋ฐ๋ผ์ฌ ์ ์์๊น?โ๋ผ๋ ์๊ฐ์ด ๋งค์ผ ๋ค์์ต๋๋ค.
๊ทธ๋ผ์๋ ์ค๋ ํฌ๊ธฐ์๊ฐ ํ๋ช
๋ ๋์ค์ง ์์ ์ํฉ์
์ ๋ ์ ๋ง ์ด ์ฌ๋๋ค์ ๋ญ๋ ํด๋ด๊ฒ ๊ตฌ๋ ์ถ์์ต๋๋ค.
์ด๋ป๊ฒ๋ ๋๊ณ ์ถ์ ๋ง์์ ์ ๋ ์๋ ค์ค ์ ์๋ ๊ฐ๋
์ ์ต๋ํ ๊ณต์ ํด๊ฐ๋ฉฐ,
๋๋ถ๋ถ์ ํ ํ๋ก์ ํธ๋ค์ ๋ค๋ฐฉ๋ฉด์ผ๋ก ๋์์ค ๊ธฐ์ต์ด ๋ฉ๋๋ค.
์๊ฐ๋๋ ๊ฒ๋ค๋ก๋,
์ฌ์ฉ ๋ฐ์ดํฐ์ ๋ณผ๋ฅจ๊ณผ ํ๋ก์ ํธ ์ ๊ทผ ๋ฐฉํฅ์ ๋ํ ๋ด์ฉ,
๊ฐ์ ํ๊ฒฝ๊ณผ GPU ์ฌ์ฉ์ ๋ํ ๋ด์ฉ,
์นํฌ๋กค๋ง ์ฝ๋๋ ์ด๋ฏธ์ง ๋ฐ์ดํฐ ํ๋ จ ์์
๋ชจ๋ธ์ ์๋ฆฌ์ ๊ธฐ๋ฐํ ์ ๊ฐ ์๊ฐํ๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐฉํฅ์ฑ ๋ฑ
๋ค์ํ๊ฒ ํผ๋๋ฐฑ์ ๋๋๋ฉฐ ๋ค ํจ๊ป ์ฑ์ฅํ ์ ์๋๋ก ์์งํ ๊ณ ์ ์ข ํ์ต๋๋ค.
์ผ์ ์ ์ํํ๋ฉด์ ๋ณ์๋ ๊ฐ๊ณ ์ ์ ํผํํด์ ธ ๊ฐ๋ ์ฌ๋๋ค์ ๋ณด๋ฉฐ ๋ง์์ด ์ํ๊ธฐ๋ ํ์ง๋ง,
์ด๊ธฐ๋ฅผ ์์ง ์๊ณ ๋
ธ๋ ฅํ์ ๋ถ๋ค์๊ฒ ๊ณ ๋ง๊ณ ์ ๋ง ์๊ณ ๋ง์๋ค๋ ์๊ธฐ๋ฅผ ํ๊ณ ์ถ์์ต๋๋ค.
๋๋ถ์ ์ ๋ ๋๊ฐ์ ์ด๊ธฐ๋ก ํจ๊ป ๊ฐ๋ฐํ๋ฉฐ ์ค์ํ ๊ฑธ ๋ฐฐ์ธ ์ ์์์ต๋๋ค.
โ๊ตด๋ฆฌ๋ฉด ๊ตด๋ฌ๊ฐ๋ ๊ฒ ์ฌ๋์ด๊ตฌ๋!โ
โ๋ญ๋ ํ๋ฉด ๋๋ค!โ
ย
ย
Project Lecture AI
์ ๋ 2์กฐ์์ ํ๋ก์ ํธ ์ด๊ด์ ๋งก์์ต๋๋ค.
์ฃผ๋ก OCR ํํธ์์ Text Detection, Text Rearrange์ ๊ฐ๋ฐ๊ณผ
Text Recognition์ ๋ณด์กฐ๋ฅผ ์ํํ๊ณ ,
TTS ํํธ์์๋ ์ด์ ๋ฐ์ ์ ์ฝ๋ ์์ ์ ๋์์ต๋๋ค.
์ ์ฒด์ ์ธ ํ๋ก์ ํธ์ ๊ด๋ฆฌ์ ๊ฐ๋ฐ ์ํฉ์ ๋ง๊ฒ ์ธ๋ถ ์กฐ์ ์ ์งํํ์ต๋๋ค.
ย
ํ๋ก์ ํธ๋ฅผ ๊ธฐํํ๊ฒ ๋ ๋ฐฐ๊ฒฝ์ ์ ๊ฐ ํ์ค์ ์ผ๋ก ๋ง์ฃผํ ๋ฌธ์ ๋ฅผ ์ธ์ํ๊ณ
๊ทธ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ํ๋ ์๊ฐ์์ ์์ด๋์ด๊ฐ ๋ฐ์ํ์ต๋๋ค.
๋ค๋ฆ ์๋ ์ด ํ๋ก๊ทธ๋จ์ ๊ต์ก ๊ณผ์ ์ด ์ง๋๊ฐ ๊ต์ฅํ ๋น ๋ฅด๊ณ ์ด๋ ค์ฐ๋ฉฐ
๋ด์ฉ์ด ์๋นํ ๋ง์๊ธฐ ๋๋ฌธ์ ์๊ธด ๋ฌธ์ ์์ต๋๋ค.
๊ต์๋์ ํ์์ ppt ๋ด์ฉ์ ํ๊ธฐํ๊ณ ์์ผ๋ฉด
๊ต์๋์ด ๋ฐ๋ก ์ธ๊ธํ์๋ ๋ด์ฉ์ ๋์ณ์ ์์
๋ด์ฉ์ ๋ํ ์ต๋ ํจ์จ์ด ๋จ์ด์ง๊ณ ,
๊ต์๋์ ๋ฐํ์ ์ง์คํ๋ฉฐ ์์
์์ฒด์ ์ง์คํ๋ฉด
ํ์ต ํจ๊ณผ๋ ์ข์ง๋ง ์์
์ดํ์ ๋ณต์ตํ๊ธฐ ์ํ ์๋ฃ๊ฐ ๋น์ฝํ์ฌ ์ด๋ ค์์ ๋๊ผ์ต๋๋ค.
*์์ฝํ์๋ฉด ์์
๋ฐ๋ผ๊ฐ๊ธฐ ๋ฒ
์ฐจ์ ์๋ ๋
ธํธ ํ๊ธฐ AI ๊ฐ๋ฐํ๊ณ ์ถ์์ต๋๋ค.
ย
์ด ์๋น์ค์ ๊ฐ๋ฐ์ ํตํด ์ฐฝ์ถํ๊ณ ์ถ์๋ ๊ฐ์น๋
์๊ฐ์๋ค์ด ์๋น์ค ์ด์ฉ์ผ๋ก ํ๊ธฐ์ ๋ํ ์๋ฐ๊ฐ์์ ๋ฒ์ด๋๊ณ
๊ต์์์ ์จ์ ํ ์ํธ์์ฉ์ ํตํด ์์
์ ์ง์ ํฅ์์ ๊ตฌ์ํ์ต๋๋ค.
์ฅ์ ์ธ ์๊ฐ ๋ณด์กฐ ์๋น์ค๋ก์ ํ์ฅ ๊ฐ๋ฅ์ฑ ๋ํ
์ ์๋ฏธํ ์ฌํ์ ๊ฐ์น ์คํ์ด๋ผ๊ณ ํ๋จํ์ฌ
์ฃผ์ ๋ฅผ ์ต์ข
์ ์ ํ๊ณ ๊ฐ๋ฐํ๊ฒ ๋์์ต๋๋ค.
ย
ํ๋ก์ธ์ค๋ ๋ค์๊ณผ ๊ฐ์ด ๋์์ธํ์ต๋๋ค.
ย
ํจ์จ์ ์ธ ๊ฐ๋ฐ์ ์ํด ํ๋ก์ ํธ๋ OCR๊ณผ TTS ํํธ๋ก ๋๋์์ต๋๋ค.
OCR ํํธ์ 2๋ช
, TTS ํํธ์ 3๋ช
์ ์ธ์์ ๋ฐฐ์ ํ์ต๋๋ค.
OCR ํํธ์์๋ ์ ๊ฐ Text Detection, Text Rearrange์ ๊ตฌํ์ ๋งก์๊ณ ,
๋ค๋ฅธ OCR ํํธ์ YJ.Han์ด Text Recognition์ ๋ด๋นํ์์ต๋๋ค.
TTS ํํธ์์๋ JS.Kwon, SY.Choi, SB.Choi ์ธ ํ์๋ค์ด Voice Recognition์ ๊ฐ๋ฐ์ ๋งก์์ต๋๋ค.
TTS ํํธ๋ ์ ๋ ์์ง ๋ชจ๋ฅด๋ ๋ถ๋ถ์ด ๋ง๊ธฐ ๋๋ฌธ์ ์ค๋ช
์์ ์๋ตํ๋๋ก ํ๊ฒ ์ต๋๋ค.
ย
ย
Text Detection Model ๊ฐ๋ฐ
Data preprocess
Dataset : IAM handwriting dataset
์์ฒ๋ผ Character ๊ฐ๊ฐ์ BBox labeling๋์ด์๋ IAM handwritting dataset์
๋ค์๊ณผ ๊ฐ์ด word ๋ณ๋ก labeling์ด ๋๋๋ก ํจ๊ณผ ๋์์
coco format์ BBox Label์ Yolo format์ผ๋ก ๋ณํํ๋ ์ฝ๋ ๊ตฌ์
=> convertxml2yolo.ipynb
ย
ย
Model train
yolov5s pretrained model์ ๊ฐ์ ธ์
์ ์ฒ๋ฆฌ๋ฅผ ๋ง์น IAM handwritting dataset์ผ๋ก
word image detection model ํ๋ จ
ย
ย
Model test
ํ๋ จ ๋ชจ๋ธ ํ
์คํธ
๊ฝค ์ ๋์ต๋๋ค.
์ฌ์ค ์์ ์ด๋ฏธ์ง๋ฅผ ์ฌ์ฉํ์ง ์๊ณ
๋จ์ด ์ด๋ฏธ์ง๋ฅผ text recognition model์ ๋๊ฒจ์ผ ํ๊ธฐ ๋๋ฌธ์
crop option์ ์ฌ์ฉํ์ฌ cropped image๋ค์ ์ถ์ถํด์ค๋๋ค.
ย
ย
image detection์ ํตํด handwritten text image์์
๊ฐ๊ฐ์ word image๋ฅผ ์ถ์ถํ์ผ๋,
์์๋ฅผ ์์ง ๋ชปํ๊ฒ ๋จ์ด๋ง ํ์ธ์ด ๋์ด
์๋ ๊ธ์ ์๋ฏธ๋ฅผ ์์ด๋ฒ๋ฆฌ๋ ๋ฌธ์ ๊ฐ ์์์ต๋๋ค.
๋ค๋ง ์ถ์ถ ์์ ๋จ์ด์ ์ขํ๊ฐ์ ํฌํจ์ํฌ ์ ์์๊ธฐ์
๊ฐ ๋จ์ด์ ์ด๋ฆ์ x,y์ขํ๊ฐ๊ณผ w,h ์ ๋ณด๋ฅผ ํฌํจํ์ฌ
๋จ์ด ์ด๋ฏธ์ง ํ์ผ์ ์์ฑํฉ๋๋ค.
๊ฐ ๋จ์ด ์ด๋ฏธ์ง๋ค์ raw img data์์ ์์น ๊ด๊ณ๋ฅผ ์๊ธฐ ์ํด,
crop image ์์ฑ ์ ์ ์ขํ ๋ฐ์ดํฐ ํ ์ฒ๋ฆฌํ์ฌ
์ด๋ฏธ์ง ํ์ผ๋ช
์ ๋ผ๋ฒจ๋งํ๋ ์ฝ๋๋ฅผ detect.py์ ์ถ๊ฐํ์ต๋๋ค.
ย
ย
Text Rearrange Process ๊ฐ๋ฐ
yolo model์ ํตํด crop๋ ์ด๋ฏธ์ง๋ค์
ํ์ผ ์ด๋ฆ์ crop๋๊ธฐ ์ raw image์์์ ์ขํ ์ ๋ณด๋ฅผ ํฌํจํฉ๋๋ค.
Example>
x89y147w199h184.jpg
x10y148w157h184.jpg
x28y149w108h180.jpg
raw imageํ์ผ์์ ๊ฐ์ line์ ์๋ word๋ค์
๊ฐ๊น์ด y๊ฐ์ ๊ฐ๊ณ ์์ ๊ฒ์ด๋ฏ๋ก,
๋ฐ๋๊ธฐ๋ฐ ๊ตฐ์งํ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ
๊ฐ์ line์ ์์ ๊ฒ์ด๋ผ๊ณ ์์ํ๋ word๊ฐ๋ค์
๋์ผ ํด๋ฌ์คํฐ์ ์ํ๊ฒ ๋ฉ๋๋ค..
์ด๋ ๊ฒ ๋์ผ ํด๋ฌ์คํฐ์ ์ํ๋ y๊ฐ๋ค์ ํ๊ท ์ ๊ตฌํ์ฌ
word์ ์๋ก์ด y๊ฐ์ผ๋ก label.
๋จ์ด ์ด๋ฏธ์ง ํ์ผ renameํ ๋, y๊ฐ์ด ๋จผ์ ์ค๊ฒ ํฉ๋๋ค.
Example>
yyyy_xxxx.jpg
y๊ฐ์ ๋ํ ์ ๋ ฌ์ด ๋๊ณ
x๊ฐ์ ๋ํด ์ค๋ฆ์ฐจ์์ผ๋ก ์ ๋ ฌ๋ฉ๋๋ค.
Example>
0148_0010.jpg
0148_0028.jpg
0148_0089.jpg
word file์ ์์๊ฐ ์๋์ ์ผ๋ก ์๋ text์ ์๋ฏธ๋ฅผ ๊ฐ์ง๊ฒ ๋ฉ๋๋ค.
ย
Text Recognition Model ๊ฐ๋ฐ
Data collection & preprocess
Text Detection์์ ์ฌ์ฉํ๋ IAM dataset์ ์ฌํ์ฉํ์ต๋๋ค.
raw image data์ ๊ฐ ๋จ์ด์ ๋ํ ํ
์คํธ ๋ผ๋ฒจ๋ง์ด ์์์ต๋๋ค.
ํ๋ จ๋ Text detection model์ ์ฌ์ฉํด
๋จ์ด ์ด๋ฏธ์ง๋ค์ ์ถ์ถํ๊ณ ํด๋น ํ
์คํธ ๋ผ๋ฒจ๊ณผ ๋งค์นญ์ํต๋๋ค.
word image์ ๋ํ word text๋ก ์ด๋ฃจ์ด์ง ์๋ก์ด dataset์ ๊ตฌ์ถํ์ต๋๋ค.
ํด๋น dataset์ IAM.m2์ด๋ผ๊ณ ํด๋๊ฒ ์ต๋๋ค.
- IAM.m2 dataset - 115,320 words
ย
๊ทธ๋ฆฌ๊ณ ์๋น์ค ๊ธฐํ์ ๋ฐ๋ผ ๋ ๊ฐ์ง ๋ชจ๋ธ์ ํ๋ จํด์ผ ํ๊ธฐ ๋๋ฌธ์
YJ.Han ํ์์ด ๊ฐ์ง๊ณ ์๋ ์๋ฌธ ํ๊ธฐ ๋
ธํธ๋ฅผ ์ ์ฒ๋ฆฌ ์์
ํ
Text Detection model๋ก 1000์ฌ๊ฐ ๋จ์ด ์ด๋ฏธ์ง ์ถ์ถํ์ต๋๋ค.
SY.Choi ํ์์ ์๋ฌธ ํ๊ธฐ ๋
ธํธ๊ฐ ์์ด
๋ฌธํ ์ํ ํ์ฌ๋ก 2000๊ฐ ๋จ์ด ์์ฑ ํ ๋์ผํ๊ฒ image cropํ์ต๋๋ค.
๋ผ๋ฒจ๋ง ์
๋ฌด ํ๋ก์ธ์ค์ ํจ์จ์ฑ์ ์ํด ์์ฒด ๋ผ๋ฒจ๋ง ํ๋ก๊ทธ๋จ ๊ฐ๋ฐ ํ,
๋ ํ์ YJ.Han, SY.Choi์๊ฒ ์ ๋ฌํ์ฌ ๊ฐ ๋จ์ด ์ด๋ฏธ์ง์ ๋ํ ๋ผ๋ฒจ๋ง์ ์ํํ์ต๋๋ค.
=>LabelingCode.ipynb
์ต์ข ์ ์ผ๋ก ์๋ก ๋ค๋ฅธ ํ์ฒด์ ๋ ๊ฐ์ง dataset์ ๊ตฌ์ถ ์๋ฃํ์ต๋๋ค.
- HYJ dataset - 1,179 words
- CSY dataset - 2,072 words
ย
ย
Model training and test
Naver Clover์ text recognition model์ ๊ฐ์ ธ์ ์ ์ดํ์ต์ ์งํํ์ต๋๋ค.
Scene Text Recognition ๋ชจ๋ธ์ ์ ํํ ์ด์ ๋
์ค์ํ์์ ๋ณด์ด๋ ๋ถ๊ท์นํ text ์ด๋ฏธ์ง์ ์ธ์์ ์ด์ ์ ๋๊ณ ๊ฐ๋ฐ๋ ๋งํผ
์
ํ, ๋
ธ์ด์ฆ๊ฐ ๋ง์ ํ์, ํ๊ธฐ ๋ฐ์ดํฐ์๋ ๊ฐ๊ฑดํ ์ฑ๋ฅ์ ๋ณด์ฌ์ค ๊ฒ์ผ๋ก ์๊ฐํจ.
ย
First Transfer Learning with IAM.m2 dataset
pretrained model์ ๋ถ๋ฌ์์ IAM.m2 dataset์ผ๋ก transfer learning์ ์งํ
IAM TextRecognition model
accuracy : 83.531
valid loss : 0.60929
ย
Second Transfer Learning with HYJ dataset
transfer learningํ IAM TextRecognition model์ ๋ถ๋ฌ์์,
{HYJ dataset}์ผ๋ก ๋ค์ transfer learning์ ์งํ
IAM-HYJ TextRecognition model
accuracy : 92.792
valid loss : 0.36510
ย
Second Transfer Learning with CSY dataset
transfer learningํ IAM TextRecognition model์ ๋ถ๋ฌ์์,
{CSY dataset}์ผ๋ก ๋ค์ transfer learning์ ์งํ
IAM-CSY TextRecognition model
accuracy : 91.220
valid loss : 0.27884
๋ค์ํ ํ๊ธฐ์ฒด๋ฅผ ๊ฐ์ง IAM์ผ๋ก ์ด๋ฒ ํ๋ จํ๊ณ ,
์ดํ ๋จ์ผ ํ๊ธฐ์ฒด์ ๋ํ (HYJ/CSY) dataset์ผ๋ก ์ฌ๋ฒ ํ๋ จ์ ์ํํ ๊ฒฐ๊ณผ,
accuracy๊ฐ ๋ง์ด ํฅ์๋ ๊ฒ์ ํ์ธํ ์ ์์์ต๋๋ค.
์๋ก ๋ค๋ฅธ ํ๊ธฐ์ฒด๋ก ๋ชจ๋ธ์ ๊ฐ๊ฐ ํ๋ จํ์ฌ,
๋์ผ ๊ธ์จ์ฒด์ ๋ํ์ฌ ๋ ์ข์ ์ฑ๋ฅ์ ์ด๋์ด๋ผ ์ ์์๊ณ ,
์ด๋ ๊ฐ์ธ-์ต์ ํ๋ ๋ชจ๋ธ ๊ฐ๋ฐ์ ์์๊ฐ ์์์ต๋๋ค.
์ถํ ๊ฐ๋ฐ ๊ฐ๋ฅ์ฑ:
๊ฐ์ฌ ์ผ๊ตด ์ธ์์ ํตํ ํ์ ๋ชจ๋ธ ์ค์์นญ.
๊ฒ์ ํ์์ผ๋ก ํ์ํ ์์
๋ด์ฉ๋ง Popup์์ผ์
ํ์ต์๊ฐ ์ํ๋ ์ ๋ณด๋ง ๊ฐ์ ธ๊ฐ ์ ์๋๋ก ๊ฐ๋ฐ.
ํผํฉ์ด, ๊ธฐํธ, ๋ํ ๋ฑ์ dataset์ ๋ํ ์ถ๊ฐ ํ๋ จ์ ํตํด
๋ ํ๋ถํ ํ์ต ์ง์์ด ๊ฐ๋ฅํ๋๋ก ๊ฐ์ .
์ํ ๋จ๋ง ๊ธฐ๊ธฐ๋ฅผ ํตํด ์ค์๊ฐ์ผ๋ก ๊ฐ์ ์์์ ์ ๋ฌ ๋ฐ์์
์ฒ๋ฆฌ ํ ์ ๋ฌํ๋ ํ๋ก์ธ์ค ์ถ๊ฐ.
ย
ย
7์๋ถํฐ 8์๊น์ง ๋๋ฌ๊ฐ์ ๊ต์ฅํ intensiveํ ๋์ธํ๋์ด์์ต๋๋คโฆ
์ด ํ๋ ์ดํ์๋ ๊ฝค ํ๋ํ ์ผ์ ์ด๋ผ๋ ๋ณ ํ ์์ด ์ํํ ์ ์์ต๋๋ค.
์๋ฆฌํธ ๋ํ์ ์ธ๊ณต์ง๋ฅ ์ ๋ต๊ณผ์ (a.k.a ์๋์ธ์ )
์๋์ธ์ 1๊ธฐ๋ก ์๋ฃ๋ฅผ ํ์ต๋๋ค.
ํ์ผ๋ฟ ํ๋ก๊ทธ๋จ์ด์๋ ๋งํผ ๋ค์ํ ์ฐ์ฌ๊ณก์ ์ด ์์๋๋ฐ์,
์๋์ธ์ 2๊ธฐ๋ ์๋ค๋ ๊ฒฐ๊ณผ๊ฐ ๋ง์ ๊ฒ์ ์ค๋ช
ํด ์ฃผ๋ ๋ฏ ํฉ๋๋ค.
๋์ ์๋ฏธ์์ 2๊ธฐ๊ฐ ์๋ ๊ฒ ์๋๋ผ
๋๋ฌด ๊ณ ๊ธ ์ธ์ ๋ฆฌ์์ค๊ฐ ๋ง์ด ๋ค์ด๊ฐ๋ ํ๋ก๊ทธ๋จ์ด๋ค ๋ณด๋
2024๋
์๋ ๋ํ์ ์ธ๊ณต์ง๋ฅ ๋ฌด์ญ์บ ํ๋ผ๋ ํ๋ก๊ทธ๋จ์ผ๋ก
๊ฐํธํ ์ ๋ฐ์ ์์๋ค๊ณ ๋ด
๋๋ค.
์ฌ์ค ์ฒ์ ์์๋ถํฐ ๋ด๋น์๊ป์
ํ๋ก๊ทธ๋จ์ด 1๊ธฐ๋ก ๋ง๋ฌด๋ฆฌํ ์๋ ์๋ค๋ ์๊ธฐ๋ฅผ ํ์
์
์ด๋ ์ ๋ ์์๋ ๊ฒฐ๊ณผ์์ต๋๋ค.
์ ๋ง ์ข์ ๊ฐ์๋ฅผ ํด์ฃผ์ ์ค์์ ๊ต์๋, ์ ํ์กฐ ๊ต์๋, ์ํฌ๊ฐ ๊ต์๋, ์ต์น์ง ๊ต์๋, ์ ํ์กฐ ๊ต์๋ ๊ฐ์ฌ๋๋ฆฝ๋๋ค.
AI์ ๋ต ๊ธฐ๊ฐ์ ํน๊ฐ์ ํด์ฃผ์ ๊น์๋กฑ๋, ์ค์ฑ์๋, SK discovery C&C์ AIํ์๋ถ๋ค๊ป
์์ฐฌ ๋ด์ฉ์ ๊ฐ์ ํด์ฃผ์
์ ๊ฐ์ฌํ๋ค๋ ๋ง์ ์ ํ๊ณ ์ถ์ต๋๋ค.
ย
ย
3ํ๋
2ํ๊ธฐ ์ข
๊ฐ ์ดํ์ ๊ฐ์ธ์ ์ผ๋ก ๋ค์ ์ฝ๋๋ฅผ ๋ฏ์ด๋ณด๋ฉฐ ์ ๋ฆฌ๋ฅผ ํ์ต๋๋ค.
์ฝ๋ ์ง๋ ๊ฒ๋ณด๋ค ์ฝ๋ ๋ณด๋ ๊ฒ ๋ ์ค์ํ๋ค๋ ์๊ธฐ๋ฅผ ์ผํ ๋ค์๋๋ฐ์.
์ฌ๋ฏธ์๋ ๊ฑธ ๋ณด๋ ์ค์ํ ๊ฒ ํ์คํฉ๋๋ค.
Lecture AI์์ TTS ํํธ๋ฅผ ์ ์ธํ๊ณ
OCR ํํธ ํ๋ก์ธ์ค๋ฅผ app์ผ๋ก ๋ฐฐํฌํด๋ดค์ต๋๋ค.
Huggingface GRADIO space์ ์ฌ๋ผ๊ฐ Note Crawling AI app์ Flowchart
ย
ย
ํ๋ฒ ์ฌ์ฉํด๋ณด์ธ์.
์๊ธ์จ ์ด๋ฏธ์ง๊ฐ ์๋๋๋ผ๋ ์๋ฌธ ํ
์คํธ ์ด๋ฏธ์ง๋ฉด ๊ฐ๋ฅํฉ๋๋ค.
Thank you for reading!
BANDALCOM๐ป