ポンコツLLM

● 稼働中

ラズパイ上で動く軽量な言語モデル。難しいことは苦手だけど、雑談やちょっとした文章のお手伝いくらいなら、けなげにこなします。応答はストリーミングで少しずつ返ってきます。

デモ

chat.demo

⌘/Ctrl + Enter

テキストを投げると、テキストが返ってきます。応答は SSE（Server-Sent Events）で1トークンずつストリーミングされます。

curl -N https://ponkotsu-lab.net/api/v1/chat \
  -H "Content-Type: application/json" \
  -d '{"message": "こんにちは"}'

フィールド	型	必須	説明
`message`	string	✔	モデルへの入力テキスト
`max_tokens`	number		最大生成トークン数（既定: 256）

data: {"delta": "こん"}
data: {"delta": "にちは"}
data: {"done": true}