AI工作站

DeepSeek遭遇了美国IP的网络攻击,导致系统一度短时闪崩!

AI行业资讯 2025-01-29 10:58:22 

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,是一家成立于2023年7月17日的创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。公司由量化投资巨头幻方量化创始人梁文锋创立,其核心团队成员多来自清华大学北京大学、北京航空航天大学等国内顶尖高校。

DeepSeek的核心产品是其开发的大语言模型,包括DeepSeek-V3、DeepSeek-R1等版本。这些模型在自然语言处理智能对话生成、代码生成、数学推理等方面表现出色,尤其在数学和编程任务上表现优异。DeepSeek-V3在多项评测中性能优于主流开源模型,而DeepSeek-R1则以极低的训练成本(仅557.6万美元)达到了与OpenAIGPT-4o相当的性能。

DeepSeek:杭州深度求索人工智能基础技术研究有限公司

DeepSeek最近相关资讯:

1. DeepSeek-V3发布  

   DeepSeek-V3是DeepSeek公司于2024年12月26日正式发布的最新模型,其参数达到671B,激活了37B参数,并在14.8T token上进行了预训练。该模型在多项评测中表现优异,例如生成速度从20 TPS提升至60 TPS,性能超越了多个国际知名开源模型如GPT-4和Claude-3.5-Sonnet等,同时API服务定价也大幅降低,每百万输入tokens仅需0.5美元。

2. DeepSeek-R1开源模型的全球影响  

   DeepSeek-R1作为DeepSeek的首个开源模型,于2024年12月底发布,并迅速在全球范围内引发轰动。该模型不仅在国内外科技圈受到高度评价,还被认为可能推动全球AI技术的发展。例如,《自然》杂志特别关注了DeepSeek-R1,并称其为“令学界振奋”的成果。

3. DeepSeek-V1-Lite-Preview推理模型  

   DeepSeek还推出了首款推理模型R1-Lite-Preview,专注于逻辑推理能力,特别是在数学和代码等复杂问题上的表现尤为突出。这一模型的推出进一步展示了DeepSeek在AI推理领域的技术实力。

4. 市场表现与资本反应  

   DeepSeek的多项创新和突破引发了资本市场和科技界的广泛关注。例如,DeepSeek-V3的发布使其在苹果中国区和美国区的应用商店免费榜中登顶,超越了Google Gemini和Microsoft Copilot等竞争对手。此外,DeepSeek概念股也出现强势上涨,浙江东方、金资本等公司股价涨停。

5. 遭遇网络攻击  

   尽管DeepSeek取得了诸多成就,但其在2025年1月遭遇了美国IP的网络攻击,导致系统一度短时闪崩。不过,DeepSeek官方迅速回应称,此次事件是由于新模型发布后用户访问量激增所致。

6. 未来展望  

   DeepSeek创始人梁文锋表示,公司将继续坚持开源社区的合作精神,为国产大模型的发展贡献力量。同时,DeepSeek也在不断优化其模型性能,以满足更多实际应用场景的需求。

获取官方网址

标签: