Qwen3.6越狱版火了

图源:AI生成示意
2026年5月下旬,一款名为 Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive 的模型在开源社区迅速走红,被称为"越狱版"Qwen3.6。
这个版本移除了官方模型的内容审查限制,同时保留了完整的推理和代码能力。对于本地部署玩家来说,这意味着真正的"模型自由"。
核心数据对比
| 模型 | 参数量 | 激活参数 | 显存门槛 | 开源/收费 | 特点 |
|---|---|---|---|---|---|
| Qwen3.6-35B-A3B Uncensored | 35B | 3B | 6G | 开源 | 无审查、支持视觉 |
| Qwen3.6 官方版 | 35B | 3B | 6G | 开源 | 有内容审核 |
| GPT-5.5(闭源参考) | 未公开 | 未公开 | API only | 收费 | 原生Agent能力 |
| Llama 4 Ultra | 约400B | 约50B | 24G+ | 开源 | 多模态强化 |
MoE架构:35B参数,6G显存可跑
这个模型的核心优势是 MoE(混合专家)架构。
总参数35B,但每次推理只激活约3B参数。计算量大幅降低,显存占用约等于一个7B模型。
实测RTX 4060 Laptop(8G显存)跑IQ2_M量化版本,输出速度约10 tokens/s。用llama.cpp原生引擎,配--jinja参数,中文输出稳定。
无审查的意义
"越狱"在这里指移除模型的安全对齐限制。
官方版遇到某些提示词会拒绝回答。这个版本直接输出,不做内容审核。适合本地研究、安全测试、以及需要模型"说实话"的场景。
值得强调的是,这个版本的能力没有打折。实测代码生成、多模态识图、长文本推理都保持高水准。
视觉能力
模型支持多模态,需要额外下载mmproj文件。启动llama-server时挂载该文件,即可支持图片分析、OCR、截图问答。
如何使用
-
下载llama.cpp(根据显卡选CUDA版本) -
下载对应量化版本的GGUF模型文件 -
双击 run.bat,浏览器打开http://127.0.0.1:8080 -
支持OpenAI API格式,可接入OpenWebUI、Cherry Studio等工具
显存对照:6-8G用IQ2_M,12-16G用IQ4_NL(推荐),24G以上用Q4_K_P。
模型链接
-
HuggingFace:https://huggingface.co/HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive[1] -
GitHub Qwen3.6官方:https://github.com/QwenLM/Qwen3.6[2] -
llama.cpp项目:https://github.com/ggerganov/llama.cpp[3]
本文涉及模型仅用于本地研究和安全测试,请勿用于非法用途。