搜索
申请入驻
关于我们
我的收藏
关注微信
微信二维码
登录
DeepSeek
亲测好用热搜
基座大模型
对话机器人
深度求索(DeepSeek)是一家专注于人工智能底层模型与技术研发的公司,致力于挑战人工智能前沿性难题。其发布并开源了多个百亿级参数的大模型,包括通用大语言模型、代码大模型以及MoE大模型。这些模型在公开评测榜单及真实样本外的泛化效果表现出色。
产品定价
产品定价
功能界面
功能界面
DeepSeek的核心功能
  • 聊天模式:提供普通会话、深度思考、联网搜索和文件处理功能。
  • 代码助手:能够理解并生成高质量的代码,适用于多种编程任务。
  • 深度思考:进行逻辑分析和推理,生成深度内容。
  • 联网搜索:集成搜索引擎,快速获取相关信息。
  • 文件模式:支持上传图片或文件,进行AI操作。
DeepSeek的主要特点
  • 混合专家架构(MoE):DeepSeek-V3采用了先进的多头潜在注意力(Multi-Head Latent Attention, MLA)技术和DeepSeekMoE架构,这使得即使参数量高达671亿,也能保持较低的预训练成本,仅需两个月的时间和557.6万美元的费用即可完成预训练。
  • 开源可商用:完全开源,允许商业用途,降低了AI技术的门槛。
  • 价格亲民:提供极具竞争力的API调用价格,如1元人民币/100万输入tokens。
  • 上下文长度:支持长达128K token的上下文,对话模式支持32K token。
DeepSeek的媒体报道

DeepSeek在AI领域引发了广泛关注,被誉为“AI界的拼多多”,因其低价策略促使其他大厂如字节跳动、腾讯等也开始降价。

DeepSeek的应用背后的人物和故事

DeepSeek的研发团队来自杭州深度求索人工智能基础技术研究有限公司,这家公司隶属于国内量化投资领域的佼佼者——幻方量化。DeepSeek之所以被称为“国产之光”,是因为它不仅实现了技术上的重大突破,还因为它的性价比极高,被网友们戏称为“AI界的拼多多”。更重要的是,DeepSeek坚持完全开源的态度,发布了详细的训练细节和技术文档,这份开放性和透明度赢得了社区内外广泛的好评和支持。团队的努力不仅仅是为了打造一款优秀的AI产品,更是为了推动整个行业的进步和发展。

公司信息
出品公司:幻方量化