Nginx中基于User-Agent的Rewrite实例

post by rocdk890 / 2012-1-22 0:22 Sunday linux技术

  一般通过User-Agent来判断,从网上抄一抄,那些列出的都不错,我的配置里加上了java、curl和Wget,方便调试和其它内部项目的抓取。因为现在很多手机网关没有发送User-Agent,所以大部分手机发送的User-Agent到了网关就被过滤掉了,相当于是空值。经过抽样调 查,User-Agent为空且为手机用户比例比较大。有部分User-Agent为空的是一些蜘蛛或垃圾程序的造访,这些垃圾流量并不那么重要。希望手 机网关将来有相应的标准,不要发送空的User-Agent,就是发送一个字母也好啊。如果应用有一个独立域名,也未必要做手机判断。譬如新浪有独立域名且深入人心,那它做不做跳转无关紧要。nginx配置用穷举方式罗列各类手机User-Agent并把空User-Agent也转到手机应用里,非这些情况,则跳到帮助页面。

  1. set $ismob 0;
  2. if ( $http_user_agent ~ "^((.*MIDP.*)|(.*WAP.*)|(.*UP.Browser.*)|(.*Smartphone.*)|(.*Obigo.*)|(.*Mobile.*)|(.*AU.Browser.*)|(.*wxd.Mms.*)|(.*WxdB.Browser.*)|(.*CLDC.*)|(.*UP.Link.*)|(.*KM.Browser.*)|(.*UCWEB.*)|(.*SEMC\-Browser.*)|(.*Mini.*)|(.*Symbian.*)|(.*Palm.*)|(.*Nokia.*)|(.*Panasonic.*)|(.*MOT\-.*)|(.*SonyEricsson.*)|(.*NEC\-.*)|(.*Alcatel.*)|(.*Ericsson.*)|(.*BENQ.*)|(.*BenQ.*)|(.*Amoisonic.*)|(.*Amoi\-.*)|(.*Capitel.*)|(.*PHILIPS.*)|(.*SAMSUNG.*)|(.*Lenovo.*)|(.*Mitsu.*)|(.*Motorola.*)|(.*SHARP.*)|(.*WAPPER.*)|(.*LG\-.*)|(.*LG/.*)|(.*EG900.*)|(.*CECT.*)|(.*Compal.*)|(.*kejian.*)|(.*Bird.*)|(.*BIRD.*)|(.*G900/V1.0.*)|(.*Arima.*)|(.*CTL.*)|(.*TDG.*)|(.*Daxian.*)|(.*DAXIAN.*)|(.*DBTEL.*)|(.*Eastcom.*)|(.*EASTCOM.*)|(.*PANTECH.*)|(.*Dopod.*)|(.*Haier.*)|(.*HAIER.*)|(.*KONKA.*)|(.*KEJIAN.*)|(.*LENOVO.*)|(.*Soutec.*)|(.*SOUTEC.*)|(.*SAGEM.*)|(.*SEC\-.*)|(.*SED\-.*)|(.*EMOL\-.*)|(.*INNO55.*)|(.*ZTE.*)|(.*iPhone.*)|(.*Android.*)|(.*Windows CE.*)|(Wget.*)|(java.*)|(curl.*)|(Opera.*))$" )
  3. {
  4. set $ismob 1;
  5. proxy_pass http://blog.slogra.com;
  6. }
  7. if ( $http_user_agent ~ ^$ )
  8. {
  9. set $ismob 1;
  10. proxy_pass http://blog.slogra.com;
  11. }
  12. if ( $ismob = 0 )
  13. {
  14. rewrite "^.*$" http://help.slogra.com/ permanent;
  15. }

2、Content-Type

手机浏览器和普通电脑访问页面有所不同,绝大多数手机不支持text/html这种Content-Type格式。在web服务方面,除了要做出合适手机浏览的页面,另外一个重要的事情就是要把Content-Type弄对了。一般手机使用的是text/vnd.wap.wml和 application/xhtml+xml,听说text/vnd.wap.wml是老式手机专用,application/xhtml+xml是3g 标准指定的Content-Type,另外charset需要指明为UTF-8。

所以Content-Type就应像如下:

  1. Content-Type: application/xhtml+xml; charset=UTF-8

这样就对了。

对于动态页面,Content-Type可以在程序里设定。

譬如php

  1. header("Content-Type: application/xhtml+xml; charset=UTF-8")

jsp的话,把顶头的page改了就好

动态程序里的设定,到了nginx上默认会继承,所以不用太多考虑。nginx要做的一个是静态页面,另一个是302跳转。

静态页面的Content-Type改起来不麻烦,修改mime.types:

  1. application/xhtml+xml                 html htm shtml;
  2. application/xhtml+xml                 xml;

把需要的扩展名对应的类型改一改就好了。然后在nginx.conf里指定charset UTF-8。

麻烦的是301和302跳转,nginx中使用rewrite的redirect和permanent跳转的时候,Content-Type怎么改都会是text/html,使用add_header,Content-Type变成了两行,没能达成目的。用代理到动态程序固然行,但性能和稳定性又成了问题。最后查阅了nginx源码,发现这个text/html是写死的……

唉,第一次修改c代码:

我调试的这个nginx是0.7.30版的,文件:

vi ./src/http/ngx_http_special_response.c

  1. 568 //r->headers_out.content_type_len = sizeof("text/html") - 1;
  2. 569 //r->headers_out.content_type.len = sizeof("text/html") - 1;
  3. 570 //r->headers_out.content_type.data = (u_char *) "text/html";

把568 569 570这三行代码注释掉,就可以让nginx跳转时不发送Content-Type,我发现在电脑的IE/FF浏览器上没有Content-Type也能正常跳转。

当然,为了严谨一些,写上Content-Type吧,现在可以用add_header定义:

  1. add_header Content-Type "text/html";

手机的就是:

  1. add_header Content-Type "application/xhtml+xml";

ps:转自www.92csz.com

夜空- 本站版权
1、本站所有主题由该文章作者发表,该文章作者与夜空享有文章相关版权
2、其他单位或个人使用、转载或引用本文时必须同时征得该文章作者和夜空的同意
3、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责
4、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意
5、原文链接:blog.slogra.com/post-116.html

标签: nginx rewrite user-agent agent user

评论: