Qwen3.6越狱版火了

AI芯片神经网络示意图
图源：AI生成示意

2026年5月下旬，一款名为 Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive 的模型在开源社区迅速走红，被称为"越狱版"Qwen3.6。

这个版本移除了官方模型的内容审查限制，同时保留了完整的推理和代码能力。对于本地部署玩家来说，这意味着真正的"模型自由"。

核心数据对比

模型	参数量	激活参数	显存门槛	开源/收费	特点
Qwen3.6-35B-A3B Uncensored	35B	3B	6G	开源	无审查、支持视觉
Qwen3.6 官方版	35B	3B	6G	开源	有内容审核
GPT-5.5（闭源参考）	未公开	未公开	API only	收费	原生Agent能力
Llama 4 Ultra	约400B	约50B	24G+	开源	多模态强化

这个模型的核心优势是 MoE（混合专家）架构。

总参数35B，但每次推理只激活约3B参数。计算量大幅降低，显存占用约等于一个7B模型。

实测RTX 4060 Laptop（8G显存）跑IQ2_M量化版本，输出速度约10 tokens/s。用llama.cpp原生引擎，配--jinja参数，中文输出稳定。

"越狱"在这里指移除模型的安全对齐限制。

官方版遇到某些提示词会拒绝回答。这个版本直接输出，不做内容审核。适合本地研究、安全测试、以及需要模型"说实话"的场景。

值得强调的是，这个版本的能力没有打折。实测代码生成、多模态识图、长文本推理都保持高水准。

模型支持多模态，需要额外下载mmproj文件。启动llama-server时挂载该文件，即可支持图片分析、OCR、截图问答。

显存对照：6-8G用IQ2_M，12-16G用IQ4_NL（推荐），24G以上用Q4_K_P。

HuggingFace：https://huggingface.co/HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive^[1]
GitHub Qwen3.6官方：https://github.com/QwenLM/Qwen3.6^[2]
llama.cpp项目：https://github.com/ggerganov/llama.cpp^[3]

本文涉及模型仅用于本地研究和安全测试，请勿用于非法用途。