본문 바로가기
728x90

Information (정보 공유)/Tech (테크)4

평가방법론 [기록] AI 엔지니어링 3장: 평가 방법론AI 모델이 강력해질수록 실패의 위험도 커지므로, 단순한 '눈대중(Eyeballing)'이 아닌 체계적이고 자동화된 평가 시스템을 구축하는 것이 AI 엔지니어링의 핵심임.1. 파운데이션 모델 평가의 어려움정답의 부재: 전통적인 ML과 달리 생성형 AI는 정답(Ground Truth)이 하나가 아니며, 가능한 모든 정답 리스트를 만드는 것이 불가능함.주관적 품질: 단순히 문장이 자연스러운지 뿐만 아니라 사실 관계 확인(Fact-check), 추론 능력, 도메인 전문 지식 등이 복잡하게 얽혀 있음.2. 언어 모델링 지표 (Proxy Metrics)모델 훈련 과정이나 초기 평가에서 대리 지표로 사용되는 통계적 수치들임.엔트로피(Entropy): 토큰이 전달하는 정보의.. 2026. 3. 13.
파운데이션 모델의 이해 [기록] AI 엔지니어링 2장파운데이션 모델을 직접 만들지 않더라도, 모델의 성능과 행동을 결정하는 4가지 축(데이터, 아키텍처, 사후 훈련, 샘플링)을 이해하는 것은 AI 앱 구축의 필수 조건임.1. 훈련 데이터 (Training Data)데이터 의존성: 모델은 훈련 데이터에 없는 언어나 지식(특수 도메인 등)은 절대 알 수 없음.영어 편향: 인터넷 데이터(Common Crawl 등)의 약 45%가 영어라 비영어권 성능이 상대적으로 낮음.품질의 중요성: 무조건 많은 양보다는 고품질로 정제된 데이터가 모델 성능을 좌우함.2. 모델링: 아키텍처와 규모 (Modeling)트랜스포머(Transformer): 어텐션(Attention) 메커니즘을 통해 문맥 내 토큰 간의 관계와 중요도를 계산하는 현재의 주류 구.. 2026. 3. 8.
Google Interview Warmup 으로 인터뷰 연습하기 Google Interview Warmup이란?Google Interview Warmup은 구글에서 제공하는 무료 온라인 툴로, 구글 면접에서 자주 등장하는 질문을 연습할 수 있다. 이 도구는 실제 면접처럼 질문을 던지고, 면접자가 음성으로 답변하면 자동으로 피드백을 제공한다. 이를 통해 면접자가 구글 면접의 스타일을 미리 체험하고 준비할 수 있다.주요 기능실제 면접 질문 연습Google Interview Warmup은 구글 면접에서 자주 등장하는 기술적 질문과 비기술적 질문을 다룬다. 알고리즘 문제나 데이터 구조 관련 질문부터 리더십, 문제 해결 능력, 협업 능력 등을 포함한 다양한 질문을 연습할 수 있다.답변 녹음 및 피드백이 도구는 면접자가 자신의 답변을 음성으로 녹음하게 하고, 그 답변에 대한 피.. 2025. 2. 11.
트위터와 비슷한 텍스트 기반의 소셜 미디어 플랫폼 ‘스레드 (Threads)’ 특징 및 주요 이슈 최근 화제가 되고 있는 ‘페이스북/인스타그램’의 메타에서 출시한 스레드(Threads) 어플의 특징과 사용 방법에 대해 소개해보고자 한다. 스레드란? 메타 인스타그램 팀에서 개발한 스레드는 텍스트 기반의 SNS 공유 플랫폼이다. 인스타그램은 사진과 비디오를 공유하며 소통할 수 있는 소셜 공유 플랫폼이라면 스레드는 텍스트를 중심으로 유저들과 서로 소통할 수 있는 새로운 플랫폼이다. 현재 텍스트 기반의 소셜 플랫폼에는 트위터가 있으며 스레드 출시 이유는 트위터에 대항하기 위함이라고 할 수도 있다. 만 16세 ~ 18세 이상의 인스타그램의 계정을 가지고 있는 유저라면 스레드를 이용할 수 있으며 현재 100개 이상의 국가에서 iOS, 안드로이드에서 다운로드가 가능하다. 16시간 만에 3000만 명 이상의 유저가.. 2023. 7. 7.
반응형