Skip to content
View softkleenex's full-sized avatar

Highlights

  • Pro

Block or report softkleenex

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
softkleenex/README.md

Sangjae Lee | AI/ML Engineer

LLM, RAG, Agentic AI, 데이터 분석, 백엔드 API를 연결해 실제 사용 가능한 AI 서비스를 만드는 데 관심이 있습니다.
경북대학교 글로벌소프트웨어융합 전공으로, 모델 실험에서 끝내지 않고 검색, 도구 호출, 평가, 배포까지 이어지는 흐름을 프로젝트로 정리해 왔습니다.


Profile

  • AI Service Engineering: LLM/RAG/Agent를 활용한 사용자-facing 서비스 구현
  • Evaluation-Driven Development: 프롬프트 실험, 테스트셋 구성, 오분류/오답 패턴 분석
  • Data & ML Competitions: DACON/Kaggle 기반 분류, 예측, 이상탐지, 과학 ML 실험
  • Backend & API: FastAPI, REST API, Docker, cloud deployment, DB/API 연동
  • Product Prototyping: 공모전/리빙랩 기반 문제 정의, MVP, 발표자료, 실서비스 흐름 정리
  • Collaboration: SKT FLY AI, 해커톤, 학교 팀 프로젝트 기반 기획-개발 협업 경험

Featured Projects

LLM / RAG / Agent

Project Summary Keywords
AI Movie Finder 사용자의 모호한 영화 취향을 검색 조건으로 변환하고, IMDb 데이터와 웹 검색 결과를 함께 활용해 추천 근거를 제공하는 MCP 기반 영화 검색 에이전트 MCP, GPT-4o-mini, Gemini, Tavily, Streamlit, GCP
Weather Life MCP 날씨, 대기질, 생활지수, 카카오맵 장소 검색을 MCP 도구로 연결한 생활형 AI 도구 서버 FastMCP, REST API, Kakao Maps, Railway
MedGemma Clinical RAG Pipeline 의료 문서를 검색해 의료진용 분석과 환자용 쉬운 설명을 분리하는 dual-agent RAG 파이프라인 RAG, FAISS, MedGemma, SentenceTransformers
DACON Car News Classification GPT-4o-mini 프롬프트만으로 자동차 뉴스 여부를 분류하고, 프롬프트별 정확도와 오분류 패턴을 비교한 평가 프로젝트 Prompt Engineering, Evaluation, Test Set
SilverLink 어르신의 음성/텍스트 입력을 바탕으로 복지 혜택을 추천하는 AI 복지 도우미. AI-conic 해커톤 최우수상 수상 Gemini, Streamlit, STT/TTS, Validation

Product / Service Prototypes

Project Summary Keywords
MDGA / LivingLab 2026 농림/스마트팜 데이터를 결합해 합성 데이터와 AI 인사이트를 제공하는 리빙랩 프로젝트. 기획, MVP, 발표, 수료/선정 자료까지 정리 FastAPI, React, PostgreSQL, Gemini, Product
Barrier-Free AI Travel Orchestrator 보행 약자를 위한 무장애 여행 코스 추천 프로토타입. 날씨 위험 감지, 무장애 API/RAG 검증, 멀티에이전트 오케스트레이션 설계 LangGraph, RAG, OpenAPI, Multi-Agent
PIIX Contest Award - Cloud-I 감정 회고 무드등 제품 콘셉트로 2026 PIIX Contest 대상 수상. 생성형 AI 이미지 반복 실험과 제품 설명 정리 Generative AI, Product Design, Prompting

ML / Data / Backend

Project Summary Keywords
K-League Pass Coordinate Prediction K리그 패스 도착 좌표 예측 대회 private leaderboard 121/1,782, 상위 6.8%. 좌표 변화량 예측과 pseudo-labeling 적용 CatBoost, LightGBM, XGBoost, Validation
Stanford RNA 3D Folding 2 LLM agent 기반 autonomous MLOps 실험 루프로 Kaggle RNA 3D 구조 예측 대회 상위 48.2% 기록 PyTorch, Kaggle API, LLM Agents
AIMO Prize 3 Solver 수학 문제 풀이를 위한 tool-integrated reasoning 및 self-correction 기반 LLM solver Qwen2.5-Math, TIR, Self-Correction
Toss CTR Prediction 광고 클릭률 예측을 위한 feature engineering 및 tree-based ensemble 실험 CTR, LightGBM, XGBoost
LLM Dashboard API LLM 서비스의 사용자, 프로젝트, 모델, 세션, 로그 관리를 위한 FastAPI 백엔드 FastAPI, Oracle DB, Docker

Additional Case Studies

Project Summary Keywords
HAI 2025 Deepfake Detection 딥페이크 영상 탐지 대회 상위 9%. DINOv2, EfficientNet, pseudo-labeling, TTA를 활용한 도메인 갭 대응 PyTorch, Vision, Ensemble
Genomic Variant Detection 유전체 변이 민감도 예측 대회 상위 11.1%. DNA sequence embedding과 contrastive learning 실험 PyTorch, Genomics, Embedding
Shipping Anomaly Detection 해운물류 센서 이상신호 분류 대회 상위 24.9%. 52개 센서에서 통계/상호작용/클러스터링 피처 구성 Anomaly Detection, Feature Engineering
Jigsaw ACRC Debugging Case Study 커뮤니티 규칙 위반 분류 대회에서 LoRA adapter/base model mismatch를 분석한 production ML 디버깅 회고 NLP, LoRA, Debugging
LLM Database Platform LLM 플랫폼 운영을 가정한 10개 테이블, 6,118개 레코드, 세션/로그/모델/프로젝트 관리를 포함한 DB 설계 Oracle SQL, ERD, Data Modeling

Open Source Contributions

Project Contribution Status
Soju06/codex-lb Account capacity recovery 상황에서 streaming client가 끊기지 않도록 keepalive/status frame, retry 흐름, HTTP bridge/WebSocket 경로, unit test를 보강 Merged PR
openai/codex Responses-compatible streaming provider가 non-content status update를 turn status UI에 표시할 수 있도록 StreamStatus 경로와 compare branch를 제안 Open issue / proposal
nth5693/gemini-kit 최신 Gemini CLI 호환을 위해 agent Markdown 파일에 mandatory YAML frontmatter를 추가하는 수정 제안 Closed PR

Timeline

2026

2025


Skills

AI / ML

Python PyTorch Scikit-learn LightGBM XGBoost CatBoost Pandas NumPy

LLM / RAG / Agent

RAG FAISS SentenceTransformers MCP FastMCP Tool Calling Prompt Evaluation Gemini API OpenAI API

Backend / Data / Deployment

FastAPI REST API Docker GCP Railway Oracle DB SQL Streamlit

Product / Frontend

React Tailwind CSS Streamlit Product Documentation Pitch Deck Prototype


Current Interests

  • 검색 품질 평가와 Agentic RAG
  • LLM 응답의 근거 충실성, hallucination, regression evaluation
  • 외부 API와 연결되는 MCP/tool-calling 서비스
  • 데이터 기반 문제 정의와 실제 서비스 배포

Pinned Loading

  1. kaggle-jigsaw-acrc-portfolio kaggle-jigsaw-acrc-portfolio Public

    Systematic debugging of LLM adapter compatibility in Kaggle Jigsaw ACRC competition

    Jupyter Notebook