Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- R2DBC Paging
- Loki 로그
- UnsupportedOperationException
- formik
- save/update
- Armeria
- reids
- 티스토리챌린지
- nGinder
- fake jwt
- intellij
- RedirectService
- 7879
- 노드간 통신
- 았
- LPOS
- 논블록킹 성능
- 개발 어렵당.ㅠ
- hbase 저장공간 설정
- 오블완
- Ingress Controller Fake
- 애자일 싫타
- 핀포인트
- 플루터
- jsonMarshaller
- 월급루팡 일지
- pinpoint 2.5.3
- OIDC
- ㅉ때
- pinpoint
Archives
- Today
- Total
대머리개발자
올라마(ollama)를 통한 서비스는 ?? 본문
728x90
나 혼자 사용하기에 딱이다. 다수에게 서비스하기에는 너무나 할 것이 많고.. 충격적인 제약사항이 있다.
하나의 요청에... 하나밖에 처리를 못한다... 전혀 예상치 못했다..
여러명에게 서비스하려면 아래처럼 ...구성..
결국 20명 동접이고..... 나머지는 웨이팅 걸어야 하고..
20개의 올라마를 올리려면 ㅋㅋ 서버 사양도....ㅎㄷㄷ
VRAM 48GB 이상 (예: A6000, 2x A100 40GB)
RAM 64~128GB 이상 권장
CPU: 16코어 이상
그냥 띠발 그럼 openAI를 쓰는게 베스트하다.
chatGPT 가격이 왜 비싼지가 체감이 되네...아오
회사 정보는 즉, 사업보고서는 1년에 한 번 추가되니깐..
AI 답변을 일괄로 RDB에 저장해야 겠다..
모든 사업보고서 AI 넘기면...약 8시간...걸리네..아오!!..아오!!
728x90
'개발이야기 > AI' 카테고리의 다른 글
회사 사업보고서를 AI로 요약하기 (2) | 2025.06.17 |
---|---|
Rag를 통한 현실적인 답변 만들기 고민 (0) | 2025.06.11 |
LLM 구축시 백터화 모델(Milvus vs FAISS vs Chroma) (1) | 2025.05.16 |
RAG의 위엄. (0) | 2025.04.23 |
무료 임베딩 기술 검토 및 TEST (0) | 2025.02.19 |