查看全部信息

日志(8)

  • [转载]URI和URL的区别

    思维艺术 发表于 2007-08-02 15:09:53

    链接:http://www.yuanma.org/data/2006/0824/article_1405.htm1.什么是URIWeb上可用的每种资源 - HTML文档、图像、视频片段、程序等 - 由一个通过通用资源标志符(Universal Resource Identifier, 简称"URI")进行定位。...

  • (转载)信息采集软件采用的正则表达式

    思维艺术 发表于 2007-08-01 16:53:46

    链接:http://cyber2005.bokee.com/5960017.html                           ...

  • ruby中使用正则表达式时"\"的影响

    思维艺术 发表于 2007-07-31 18:30:41

    注:在某些浏览器或环境中\会显示成¥。 sub(gsub, sub!, gsub!)的参数 不要把字符串传给第一参数 因为一旦把字符串传给第一参数的话,就会依次进行下列处理过程 对字符串的元字符进行解释(编译脚本时) 运行sub, gsub时,...

  • (转载)常用的正则表达式

    思维艺术 发表于 2007-07-31 16:30:57

    正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。 匹配中文字符的正则表达式: [\u4e00-\u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(...

  • Web Spider的一些资料

    思维艺术 发表于 2007-07-30 16:15:07

    转载:http://blog.joycode.com/uestc95/archive/2004/09/27/34582.aspx?Pending=true    最近要开始Web Spider的开发工作,陆续收集了一些资料,分享一下,等Spider开发完毕后再将开发心得整理一下。  ...

  • 一个蜘蛛程序

    思维艺术 发表于 2007-07-30 15:16:34

    转载:http://www.highya.com/viewthread.php?tid=6350标题:一个蜘蛛程序实现网页抓取和存储(搜索引擎实现原理) PHP实现    在论坛里看到有人发了爬虫程序,无意中想到我很久前也写过一个,找了找硬盘中的...

  • Spider技术:设计Spider时要解决的几个问题

    思维艺术 发表于 2007-07-30 13:38:45

    作者:渡渡鸟工作室 http://hi.baidu.com/dudubirdstudio (版权所有,转载须注明出处) spider是整个搜索引擎系统中很重要的一个组成部分,可以说是搜索引擎的基础。它不仅仅是为搜索引擎提供了搜索对象——海量数...

  • Programming a Spider in Java

    思维艺术 发表于 2007-07-30 11:23:29

    Introduction Spiders are programs that can visit Web sites and follow hyperlinks. By using a spider, you can quickly map out all of the pages contained on a Web site. This article will show you how to...

TAG信息

资料库

相关TAG

  • 暂无相关TAG