NanoGPTはOpenRouterのようなLLMルーターサービスです。
DeepSeekやGLM4.7といった各種オープンウェイトモデルのほか、Sonnet、Opus、ChatGPT、Geminiなどのクローズドモデルも提供されています。
公式WebサイトからSillyTavernのキャラクターカードを読み込ませてチャットする事もできるほか、OpenAI互換APIも提供されているのでOpenWebUIやSillyTavernと接続して利用する事もできます。
DeepSeekやGLM4.7といった各種オープンウェイトモデルのほか、Sonnet、Opus、ChatGPT、Geminiなどのクローズドモデルも提供されています。
公式WebサイトからSillyTavernのキャラクターカードを読み込ませてチャットする事もできるほか、OpenAI互換APIも提供されているのでOpenWebUIやSillyTavernと接続して利用する事もできます。
従量課金制を基本としつつ、月8ドルのサブスク(Pro)に加入することでオープンウェイトモデルが従量課金の対象から外れ、オープンウェイトモデルに限り一日あたり2,000リクエスト(1分あたり60リクエスト)まで追加料金無しで利用できます。
サブスクに加入してオープンウェイトモデルを利用する場合はトークンの量に関係なくリクエスト単位なので、一度に大量のトークンを入力しても1リクエストとして扱われます。 一週間あたり最大6000万の入力トークン制限がかかるようになりました。
サブスク対象のオープンウェイトモデルに関しては下記のURLのモデル一覧で「Subscription」が「yes」になっているモデルが対象です。
https://nano-gpt.com/pricing
そのほかサブスクに加入している場合、特典としてSonnet、Opus、ChatGPT、Geminiなどのクローズドモデルを利用する場合に料金が5%OFFされます。
サブスクに加入してオープンウェイトモデルを利用する場合は
サブスク対象のオープンウェイトモデルに関しては下記のURLのモデル一覧で「Subscription」が「yes」になっているモデルが対象です。
https://nano-gpt.com/pricing
そのほかサブスクに加入している場合、特典としてSonnet、Opus、ChatGPT、Geminiなどのクローズドモデルを利用する場合に料金が5%OFFされます。


今回はGoogleアカウントでログインします。

アカウント連携、ログイン後にサイト左の「Subscription」からサブスクへ加入します。

「JCB」、「VISA」、「Mastercard」などのクレカが使えます。

サブスク加入後、アカウント設定からいろいろ変更して行きます。
Web上だけの設定かもしれませんが、「Conversation」の「Mature content」を有効にしておきます。

「Subscription」セクションの「Also show paid models」(有料モデルも表示)と、「Enable paid models on API」(APIで有料モデルを有効にする)をOFFにします。※サブスクの範囲で使用する場合のみ

https://nano-gpt.com/api
上記のURLにアクセスしてAPIキーを作成します。

「API」を「チャット完了」に、「チャット補完ソース」を「NanoGPT」、「NanoGPT API Key」に先ほど作成したAPIキーを貼り付けて完了です。
SillyTavern自体の使い方などはSillyTavernの使い方などページをご覧ください。


Common Settings(AI応答の構成) / チャット完了のプリセットから、サンプリング設定や「クイックプロンプトの編集」の「メイン」に脱獄文などを記述出来ます。
脱獄文の例 (※文章生成AIでオナニー プロンプトまとめwikiや、AIツールでオナニーまとめwikiの脱獄プロンプトをお借りして一部改変しています。
https://nano-gpt.com/api
上記のURLにアクセスしてAPIキーを作成します。


[Ctrl] + [.]で設定画面から「管理者設定」を開き、「接続」セクションから「OpenAI API接続の管理」のプラスボタンをクリックして、APIベースURLを下記の通りに入力します。
OpenWebUI自体の使い方などはOllama & Open WebUIの使い方などページをご覧ください。
上記のURLにアクセスしてAPIキーを作成します。


[Ctrl] + [.]で設定画面から「管理者設定」を開き、「接続」セクションから「OpenAI API接続の管理」のプラスボタンをクリックして、APIベースURLを下記の通りに入力します。
# 通常 https://nano-gpt.com/api/v1 # サブスク対象のモデルのみ https://nano-gpt.com/api/subscription/v1あとはAPIキーを貼り付けて保存すれば完了です。
OpenWebUI自体の使い方などはOllama & Open WebUIの使い方などページをご覧ください。
https://nano-gpt.com/invite/6bXtnAME
上記のURLから登録するとクローズドモデルを利用するために課金する際、料金が5%OFFされます。
※サブスク代は割引対象外なのでご注意ください。
上記のURLから登録するとクローズドモデルを利用するために課金する際、料金が5%OFFされます。
※サブスク代は割引対象外なのでご注意ください。
GLM-4.7よりロールプレイ性能上がっている,Kimi-K2.5より出力が早いものの、総合的にKimi-K2.5に少し劣る感じ(地の文が弱い)ただ、Kimi-K2.5がすぐにNSFWなシーン、描写に持っていこうとするのに対してGLM-5はそうでないのでそういう意味では優れいている(RPだけするならKimi-K2.5より良いかも),プロンプトで改善するかも?,Context長200K、デフォルトの推奨サンプリング設定はtemperature=1.0, top_p=.95,だがtemperatureは0.75前後程度まで下げても良いかと,RPチャット向き
通常版と思考版が提供されている,他のモデルと比べると地の文が強く、RPチャットより小説向きかも?,ただ、直結気味(プロンプトで改善するかも? →改善した),推奨サンプリング設定などはこちらを参考に → 思考版の方だが temperature=0.7 top_p=0.95 tok_k=20 min_p=0 repeat penalty=1.0 ぐらいで良いかも,GLM-5より好みかな,LLMプロバイダの問題か、思考版を使ってるのに正常に思考しない事が何回かあったのと、正常に思考しても思考が長いので注意

