国产大模型deepseek-v4,结果被搞ai 评测的大佬@ karminski-牙医给否认了

最近国产大模型这块动静可真大,大家都在等DeepSeek V4呢,结果不是发布就是跳票,这次听说OpenRuter平台上有两个新家伙,代号Hunter Alpha和Healer Alpha,真的是把我给馋坏了。 你看这个Hunter Alpha,听说参数就高达1万亿,上下文能撑到1M,多模态输出都有,简直太牛了!还有一个Healer Alpha,上下文是262k,输出速度那是相当快。不少人猜测这是不是DeepSeek V4呢,结果被搞AI评测的大佬@karminski - 牙医给否认了,说这是智谱的新品。 话虽这么说,DeepSeek那边的消息也没断过。之前就传得沸沸扬扬说DeepSeek V4有1万亿参数量、MOE激活320亿、支持1M上下文,还为昇腾910C做了优化。不过这些都挺玄乎的。倒是有个更靠谱的消息,那位@bdsqlsz居然在HuggingFace上把DeepSeek - V4 - INT8的权重给传上去了,这说明DeepSeek V4支持INT8算法,看来是真要发布了。 还有听说供应商那边要在6 - 20号保持稳定,最近两天也在搞压力测试。综合来看,DeepSeek V4马上就要跟我们见面啦!不管是Openruter、HuggingFace、NVIDIA还是AMD,这一仗看谁赢?总之啊,大家就等好吧!