PHP实时输出的chunk大小由Web服务器和PHP缓冲机制共同决定,无法通过PHP函数直接设置;关键需禁用zlib压缩、关闭output_buffering,并配置Nginx/Apache禁用gzip、buffering等代理层缓冲。
很多人以为 ob_flush() 或 flush() 能控制每次发给浏览器的数据块大小,其实它们只是触发刷新,真正发送的 chunk 尺寸取决于底层:Nginx 默认 4KB、Apache 的 BufferedLogs 或 SendBufferSize、PHP 的 output_buffering 和 zlib 压缩开关。你调用一次 echo "a" + flush(),浏览器可能等 4096 字节才收到第一个 TCP 包。
这是最常踩的坑:即使关了 output_buffering,只要 zlib.output_compression = On(或在脚本里开了 ob_start('ob_gzhandler')),PHP 会强制累积数据直到达到 zlib 内部缓冲阈值(通常是 4KB),flush() 完全无效。
php -i | grep zlib.output_compression,确认值为 Off
ini_set('zlib.output_compression', '0');(必须在任何输出前调用)ob_start(),确保没传
Nginx 默认启用 gzip 和 proxy_buffering,这两者都会吞掉小 chunk;Apache 的 mod_deflate 和 EnableSendfile 同理。PHP 没有 API 能告诉 Nginx “现在发 1 字节”,只能靠服务端配置让管道变“细”:
gzip off;、proxy_buffering off;、chunked_transfer_encoding on;
mod_deflate,设 EnableSendfile off,并确保 SetOutputFilter none
fastcgi_buffering off;(Nginx 1.11.5+)以下代码在正确服务端配置下,可做到接近逐字符推送(实际仍受 TCP/IP 栈和浏览器解析策略影响):
注意:
ob_flush()和flush()必须成对出现;usleep()不是必须,但没有它,循环太快会导致多个 tick 合并在一个 TCP 包里发出——这不是 PHP 的问题,是内核 Nagle 算法在起作用。真正难调的从来不是 PHP 代码,而是跨层协同:PHP 缓冲关了,Web 服务器没关压缩;服务端调好了,CDN 又加了一层缓冲;甚至某些浏览器(如 Safari)对非
text/event-stream类型的流式响应会静默攒包。调优时得一层层抓包验证,别只盯着echo和flush()。