关于 DeepSeek 1
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司 。DeepSeek 是一家创新型科技公司 ,成立于2023年7月17日 ,使用数据蒸馏技术 ,得到更为精炼、有用的数据 。由知名私募巨头幻方量化孕育而生 ,专注于开发先进的大语言模型(LLM)和相关技术 。注册地址 :浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室 。法定代表人为裴湉 ,经营范围包括技术服务、技术开发、软件开发等 。
2024年1月5日,发布DeepSeek LLM(深度求索的第一个大模型) 。1月25日,发布DeepSeek-Coder 。2月5日,发布DeepSeekMath。 3月11日,发布DeepSeek-VL。5月7日,发布DeepSeek-V2 。6月17日,发布DeepSeek-Coder-V2。9月5日,更新 API 支持文档,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat ,推出 DeepSeek V2.5 。12月13日,发布DeepSeek-VL2。12月26日晚,正式上线DeepSeek-V3首个版本并同步开源 。2025年1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIANIM。同一时段内,亚马逊和微软也接入DeepSeek-R1模型。英伟达称,DeepSeek-R1是最先进的大语言模型。2月5日消息,DeepSeek-R1、V3、Coder 等系列模型,已陆续上线国家超算互联网平台。2月6日消息,澳大利亚政府以所谓“担心安全风险”为由,已禁止在所有政府设备中使用DeepSeek。2月8日,DeepSeek正式登陆苏州,并在苏州市公共算力服务平台上完成部署上线,为用户提供开箱即用的软硬件一体服务。
发展历程
DeepSeek成立于2023年7月17日,由知名量化资管巨头幻方量化创立。DeepSeek 是一家创新型科技公司,长久以来专注于开发先进的大语言模型(LLM)和相关技术,作为大厂外唯一一家储备万张A100芯片的公司,幻方量化为DeepSeek的技术研发提供了强大的硬件支持。
2024年5月7日,DeepSeek发布了MoE架构的DeepSeek V2。两天后,第一财经技术中心就对DeepSeek发布的技术报告和模型进行了深度分析与研究。经过严谨的评估,团队认为DeepSeek V2在架构设计、性能表现等方面与财经垂类大模型的需求高度契合,于是果断决定将基座模型迁移至DeepSeek V2,并迅速启动了以DeepSeek V2为主力基座模型的财经垂类大模型的训练与应用研发工作。
2024年9月5日,DeepSeek 官方更新 API 支持文档,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型,升级推出全新的 DeepSeek V2.5 新模型。官方表示为向前兼容,API 用户通过 deepseek-coder 或 deepseek-chat 均可以访问新的模型。
2024年12 月,一份关于DeepSeek发布历程、优化方向的专家会议纪要文件在业内流传。对此,DeepSeek 回应称,公司未授权任何人员参与券商投资者交流会,所谓“DeepSeek 专家”非公司人员,所交流信息不实。DeepSeek 表示,公司内部制定有严格的规章制度,明令禁止员工接受外部访谈、参与投资者交流等市场上各类面向投资者的机构信息交流会。相关事项均以公开披露信息为准。
2025年1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一 。根据公开报道,DeepSeek的员工规模不及OpenAI的1/5,百人出头的公司中,算子、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人,主要在北京分部,其余30多人在杭州总部,多为前端、产品以及商务人员。
2025年1月28日消息,DeepSeek于服务状态页面公告称:近期DeepSeek线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式,已注册用户可以正常登录。
2025年1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM。同一时段内,亚马逊和微软也接入DeepSeek-R1模型。英伟达称,DeepSeek-R1是最先进的大语言模型。
2025年2月消息,DeepSeek-R1大模型一键部署至腾讯云「HAI」上,开发者仅需3分钟就能接入调用。
2025年2月5日消息,DeepSeek-R1、V3、Coder 等系列模型,已陆续上线国家超算互联网平台。
2025年2月6日,DeepSeek已暂停API服务充值,按钮显示灰色不可用状态。对此官方声明称,“当前服务器资源紧张,为避免对您造成业务影响,我们已暂停API服务充值。
2025年2月6日消息,中国电信、中国移动、中国联通三大运营商相继宣布全面接入DeepSeek。2月6日,DeepSeek发布声明称,注意到部分与DeepSeek有关的仿冒账号和不实信息对公众造成了误导和困扰。与DeepSeek有关的一切信息以官方账号发布为准,任何非官方账号、个人账号发布的信息均不代表DeepSeek观点。
2025年2月6日,吉利汽车宣布其自研的星睿大模型与DeepSeek R1大模型已完成深度融合,这是汽车行业首次实现此类深度合作。 2月7日,岚图汽车已完成与DeepSeek模型的深度融合。2月8日,宝骏汽车宣布其灵语智舱与DeepSeek大模型完成深度融合。2月8日消息,QuestMobile的最新数据显示, DeepSeek在1月28日的日活跃用户数首次超越豆包,随后在2月1日突破3000万大关,成为史上最快达成这一里程碑的应用。2月8日,DeepSeek正式登陆苏州,并在苏州市公共算力服务平台上完成部署上线,为用户提供开箱即用的软硬件一体服务。 2月9日,上汽荣威飞凡与DeepSeek达成深度技术融合。2月10日消息,DeepSeek已正式登陆常州在中国移动长三角(常州)智算中心。2月,DeepSeek获顶级域名ai.com认可。2月9日,花山区垂直行业AI大模型训练算力中心完成DeepSeek大模型本地化部署并上线。2月10日消息,移动云全面上线DeepSeek实现全版本覆盖、全尺寸适配、全功能畅用并行科技智算云平台已快速完成了DeepSeek模型部署,东方国信幕僚智数大模型训推平台等产品快速完成了与DeepSeek-R1系列大模型的深度集成。2月10日晚,比亚迪集团高级副总裁、汽车新技术研究院院长杨冬生在比亚迪智能化战略发布会上宣布,比亚迪“璇玑架构”全面接入DeepSeek。2月10日,江汽集团发布消息称,已在其智聆座舱系统中接入DeepSeek大模型。