Aimhub 全模型API测试平台(国内测试接口)
  1. Moonshot
Aimhub 全模型API测试平台(国内测试接口)
  • 介绍
  • 发出请求
  • 项目说明
  • 导言
  • 身份验证
  • 参数详情
  • 模型列表(Models)
    • 模型对象
    • 模型列表获取(支持动态同步)
      GET
  • 聊天接口(Chat)
    • 聊天完成示列
    • 聊天完成块对象示列
    • Openai
      • gpt-3.5-turbo
      • gpt-3.5-turbo-0301
      • gpt-3.5-turbo-0613
      • gpt-3.5-turbo-1106
      • gpt-3.5-turbo-0125
      • gpt-3.5-turbo-16k
      • gpt-3.5-turbo-16k-0613
      • gpt-4
      • gpt-4-0314
      • gpt-4-0613
      • gpt-4-1106-preview
      • gpt-4-0125-preview
      • gpt-4-turbo-preview
      • gpt-4-32k
      • gpt-4-32k-0314
      • gpt-4-32k-0613
    • 阿里
      • qwen-turbo
      • qwen-plus
      • qwen-max
      • qwen-max-1201
      • qwen-max-longcontext
    • 文心千帆
      • 对话 Chat
        • ERNIE-Bot-4
        • ERNIE-Bot
        • ERNIE-Bot-turbo
    • 智谱
      • chatglm_lite
      • chatglm_std
      • chatglm_pro
      • chatglm_turbo
      • glm-3-turbo[128k]
      • glm-4[128k]
    • 腾讯
      • hunyuan
    • 讯飞
      • SparkDeskv1.1
      • SparkDeskv2.1
      • SparkDeskv3.1
      • SparkDeskv3.5
    • Moonshot
      • moonshot-v1-8k
        POST
      • moonshot-v1-32k
        POST
      • moonshot-v1-128k
        POST
    • Google
      • gemini-pro
    • Claude
      • claude-2.0
      • claude-2.1
      • claude-3-haiku-20240229
      • claude-3-opus-20240229
      • claude-3-sonnet-20240229
      • claude-3-5-sonnet-20240620
    • stepfun
      • step-1-32k
      • step-1v-32k
      • step-1-200k
  • 视觉模型(Vision)
    • gpt-4-vision-preview(视觉)
      POST
    • gpt-4-1106-vision-preview
      POST
    • gemini-pro-vision(多模态)
      POST
    • glm-4v(多模态)
      POST
  • 音频接口(Audio)
    • 创建翻译
    • TTS语音转文本
    • TTS文本转语音-alloy
    • TTS文本转语音-onyx
    • TTS-1-hd文本转语音-alloy
  • 自动补全(Completions)
    • 完成对象
    • 内容补全接口
  • 微调(Fine-tuning)
    • 微调作业对象
    • 微调作业事件对象
    • 创建微调作业
    • 列出微调作业
    • 检索微调作业
    • 取消微调
    • 列出微调事件
  • 向量生成接口(Embeddings)
    • 嵌入对象
    • 文心千帆 向量 Embeddings
      • Embedding-V1
    • 创建嵌入
  • 图像(Images)
    • DALL-E
      • README
      • 图像对象
      • DALL·E 2
      • DALL·E 3
      • 创建图像
      • 创建图片编辑
      • 创建图像变体
    • Midjourney API(测试中)
      • 任务查询
        • 指定ID获取任务
        • 获取任务图片的seed(需设置mj或niji的私信ID)
      • 任务提交
        • 提交Blend任务
        • 提交Describe任务
        • 提交Modal
        • 提交Shorten任务
        • 上传文件到discord
        • 执行动作
        • 提交Imagine任务
      • InsightFace任务提交
        • 提交swap_face任务
    • CogView
  • 文件(Files)
    • README
    • 文件对象
    • 上传文件
    • 删除文件
    • 检索文件
    • 检索文件内容
    • 列出文件
  • 审查(Moderations)(openai)
    • 调节对象
    • 创建内容审核
  • 助手测试版(AssistantsBeta)
    • 辅助对象
    • 辅助文件对象
    • 创建助手
    • 检索助手
    • 修改助手
    • 删除助手
    • 列出助手
    • 创建辅助文件
    • 检索助手文件
    • 删除辅助文件
    • 列出助手文件
  • 线程数(Threads)
    • 线程对象
    • 创建线程
    • 检索线程
    • 修改线程
    • 删除话题
  • 留言(Messages)
    • 消息对象
    • 消息文件对象
    • 创建消息
    • 检索消息
    • 修改留言
    • 列出消息
    • 检索消息文件
    • 列出消息文件
  • 运行(Runs)
    • 运行对象
    • 运行步骤对象
    • 创建运行
    • 检索运行
    • 修改运行
    • 列表运行
    • 提交工具输出以运行
    • 取消运行
    • 创建线程并运行
    • 检索运行步骤
    • 列出运行步骤
  • 已弃用
    • 创建转录
    • 创建翻译
  • 帮助中心
    • 常见问题及解决办法
  • all model test
    POST
  1. Moonshot

moonshot-v1-128k

POST
https://api.gaiasc.com/v1/chat/completions
最后修改时间:2024-03-04 05:59:19
责任人:Vtea
基本概念介绍
语言模型推理服务
语言模型推理服务是一个基于我们 (Moonshot AI) 开发和训练的预训练模型的 API 服务。它可以用于生成文本、问答、摘要、翻译等任务。在设计上,我们对外主要提供了一个 Chat Completions 接口,它可以用于生成文本,但是它本身是不支持访问网络、数据库等外部资源,也不支持执行任何代码。
令牌 (token)
文本生成以令牌(token) 为块来处理文本。令牌代表常见的字符序列。例如,单个汉字"夔"可能会被分解为若干令牌的组合,而像"中国"这样短且常见的短语则可能会使用单个令牌。大致来说,对于一段通常的中文文本,1 个令牌大约相当于 1.5-2 个汉字。
需要注意的一个限制是,对于我们的文本模型,输入消息和生成的输出合并起来的长度不能超过模型的最大上下文长度。
速率限制
这些速率限制是如何工作的?
速率限制通过五种方式衡量:RPM(每分钟请求数)、RPD(每天请求数)、TPM(每分钟令牌数)、TPD(每天令牌数)。速率限制可能会在任何一种选项中达到,取决于哪个先发生。例如,你可能向 ChatCompletions 发送了 20 个请求,每个请求只有 100 个令牌,那么你就达到了限制(如果你的 RPM 限制是 20),即使你在这些 20 个请求中没有发满 200k 个令牌(假设你的TPM限制是 200k)。
对网关,出于方便考虑,我们会基于请求中的 max_tokens 参数来计算速率限制。这意味着,如果你的请求中包含了 max_tokens 参数,我们会使用这个参数来计算速率限制。如果你的请求中没有包含 max_tokens 参数,我们会使用默认的 max_tokens 参数来计算速率限制。当你发出请求后,我们会基于你请求的 token 数量加上你 max_tokens 参数的数量来判断你是否达到了速率限制。而不考虑实际生成的 token 数量。
而在计费环节中,我们会基于你请求的 token 数量加上实际生成的 token 数量来计算费用。
其他值得注意的重要事项:
速率限制是在用户级别而非密钥级别上实施的。
目前我们在所有模型中共享速率限制。
模型列表
你可以使用我们的 List Models API 来获取当前可用的模型列表。
当前的,我们支持的模型有:
moonshot-v1-8k: 它是一个长度为 8k 的模型,适用于生成短文本。
moonshot-v1-32k: 它是一个长度为 32k 的模型,适用于生成长文本。
moonshot-v1-128k: 它是一个长度为 128k 的模型,适用于生成超长文本。
以上模型的区别在于它们的最大上下文长度,这个长度包括了输入消息和生成的输出,在效果上并没有什么区别。这个主要是为了方便用户选择合适的模型。
使用指南
获取 API 密钥
你需要一个 API 密钥来使用我们的服务。你可以在我们的控制台中创建一个 API 密钥。(TODO: 添加控制台地址)
发送请求
你可以使用我们的 Chat Completions API 来发送请求。你需要提供一个 API 密钥和一个模型名称。你可以选择是否使用默认的 max_tokens 参数,或者自定义 max_tokens 参数。可以参考 TODO: (Chat Completions API Quick Start)。
处理响应
通常的,我们会设置一个 5 分钟的超时时间。如果单个请求超过了这个时间,我们会返回一个 504 错误。如果你的请求超过了速率限制,我们会返回一个 429 错误。如果你的请求成功了,我们会返回一个 JSON 格式的响应。
如果是为了快速处理一些任务,你可以使用我们的 Chat Completions API 的非 streaming 模式。这种模式下,我们会在一次请求中返回所有的生成文本。如果你需要更多的控制,你可以使用 streaming 模式。在这种模式下,我们会返回一个 SSE 流,你可以在这个流中获取生成的文本,这样用户体验可能会更好,并且你也可以在任何时候中断请求,而不会浪费资源。

请求参数

Header 参数

Body 参数application/json

示例
{
  "model": "gpt-3.5-turbo",
  "messages": [{"role": "user", "content": "Hello!"}]
}

示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.gaiasc.com/v1/chat/completions' \
--header 'Accept: application/json' \
--header 'Accept;' \
--header 'Authorization: Bearer ' \
--header 'Authorization;' \
--header 'Content-Type: application/json' \
--data-raw '{
  "model": "gpt-3.5-turbo",
  "messages": [{"role": "user", "content": "Hello!"}]
}'

返回响应

🟢200成功
application/json
Body

示例
{
    "id": "cmpl-8b3a402cf6db4ed68d0ec4552163ff0b",
    "object": "chat.completion",
    "created": 4228671,
    "model": "moonshot-v1-128k",
    "choices": [
        {
            "index": 0,
            "message": {
                "role": "assistant",
                "content": " Hello! How can I help you today? If you have any questions or need assistance, feel free to ask."
            },
            "finish_reason": "stop"
        }
    ],
    "usage": {
        "prompt_tokens": 5,
        "completion_tokens": 24,
        "total_tokens": 29
    }
}
修改于 2024-03-04 05:59:19
上一页
moonshot-v1-32k
下一页
gemini-pro
Built with