- 浏览: 106076 次
- 性别:
- 来自: 成都
最新评论
-
sp42:
Oracle 不是很吊的么,怎么连个分页都这么麻烦?
数据库分页大全(oracle利用解析函数row_number高效分页) -
metarnetyflu:
不知道哪里快了!!!over()是最慢的,rownum其次,r ...
数据库分页大全(oracle利用解析函数row_number高效分页) -
wfd0807:
09年发的博文,五年了,一定影响到了不少人。首先,你描述的三层 ...
数据库分页大全(oracle利用解析函数row_number高效分页) -
diyunpeng:
学习了,写的不错。
python urlOpen使用代理 -
qepwqnp:
帖子沉的好深,涝起来
js_自己封装一个可查询frame中对象的一个方法
文章列表
本文章部分内容为转载-----
本人学习python中,用得最多的还是各类爬虫脚本:写过抓代理本机验证的脚本,写过在discuz论坛中自动登录自动发贴的脚本,写过自动收邮件的脚本,写过简单的验证码识别的脚本,本来想写google music的抓取脚本的,结果有了强大的gmbox,也就不用写了。
-
这些脚本有一个共性,都是和web相关的,总要用到获取链接的一些方法,再加上simplecd这个半爬虫半网站的项目,累积不少爬虫抓站的经验,在此总结一下,那么以后做东西也就不用重复劳动了。
-
1.最基本的抓站
import urllib2
content = urllib2.urlopen(' ...
利用urllib包
import urllib
proxyConfig = 'http://%s:%s@%s' % ('userName', 'password', 'proxy')
inforMation = urllib.urlopen("http://tianya.cn", proxies={'http':proxyConfig})
print inforMation.read()
userName:用户名
password:密码
proxy: 代理加端口
利用urllib2包
import urllib2
proxyConfig = 'h ...
weburl = 'xyz'
print "get web %s is fail"(weburl)
提示错误:
print "get web %s is fail"(weburl)
TypeError: 'str' object is not callable
出错原因: 给字符串中%s赋值时前加上%
正确写法:
weburl = 'xyz'
print "get web %s is fail"%(weburl)
运行正常了,输出
get web ...
步骤:(无法上传图片)
1 确保TOMCAT在DEBUG模式下启动
在启动文件catalina.bat中设置DEBUG_OPTS
set DEBUG_OPTS=-Xdebug -Xrunjdwp:transport=dt_socket,server=y,address=8765 //端口为8765
linux下可直接使用(默认debug端口为8000)
./catalina.sh jpda run
2 启动TOMCAT
Tomcat运行时提示listening for transport dt_socketat address:8765,等待接入
3 设置Ecl ...
本文出自http://blog.csdn.net/yeahq
,转载请注明出处
由于其运行环境的特殊性,Javascript大量使用异步的通信机制,凡是涉及到网络调用和事件机制的代码都会涉及。在异步通信的环境下编码经常会用到
回调函数。Javascript由于有 ...
- 2011-04-06 23:05
- 浏览 1066
- 评论(0)
转至:http://wangshuxing123-126-com.iteye.com/blog/703735
在Linux下面部署应用的时候,有时候会遇上Socket/File: Can’t open so many files的问题,其实Linux是有文件句柄限制的(就像WinXP?),而且默认不是很高,一般都是1024,作为一台生产服务器,其实很容易就达到这个数量,因此我们需要把这个值改大一些。
大概知道ulimit这个命令是相关的,上Google搜索了一下,大多数说的很含糊,也没有统一说一下,经过两个小时看了不少文章终于弄清楚ulimit相关的一些配置问题。
我们可以用uli ...
描述:Ethtool是用于查询及设置网卡参数的命令。
概要:
ethtool ethX //查询ethX网口基本设置
ethtool –h //显示ethtool的命令帮助(help)
ethtool –i ethX //查询ethX网口的相关信息
ethtool –d ethX //查询ethX网口注册性信息
ethtool –r ethX //重置ethX网口到自适应模式
ethtool –S ethX //查询ethX网口收发包统计
ethtool –s ethX [speed 10|100|1000]\ ...
项目中有这样的需求,通过IP地址判断客户端是网通的还是电信的。从同事那拿了个纯文本的IP纯真数据库,用Python写了一个小程序,感觉挺好的。点击这里
查看例子。
源码下载
#!/usr/bin/env python
# -*- coding: utf-8 -*-
from bisect import bisect
_LIST1, _LIST2 = [], []
_INIT = False
ip2int = lambda ip_str: reduce(lambda a, b: (a << 8) + b, [int(i) for i in ...
- 2011-03-28 23:11
- 浏览 859
- 评论(0)
转自:http://yangguangfu.javaeye.com/blog/796062
一,重要性AndroidManifest.xml是Android应用程序中最重要的文件之一。它是Android程序的全局配置文件,是每个 android程序中必须的文件。它位于我们开发的应用程序的根目录下,描述了package ...
- 2011-03-22 19:56
- 浏览 781
- 评论(0)
Launcher的AndroidManifest.xml文件有很多特殊性,分析一下就会理解整个程序的大概结构。
代码如下:
<
manifest
xmlns:android
=
http://schemas.android.com/apk/res/android
package
=
"net.sunniwell.launcher"
android:versionCode
=
"1"
android:versionName
=
&q ...
- 2011-03-22 11:50
- 浏览 912
- 评论(0)
这个章节描述怎么实现一个基本的Android界
面。它涉及构建屏幕基本元素,怎么在xml(定义文件)内定义屏幕、用你的代码生成、在不同任务你需要操作你的用户接口。
Android
生成屏幕有三种方式:xml配置生成;通过你自己 ...
- 2011-03-21 21:56
- 浏览 747
- 评论(0)
源文出版:http://darkbull.net/101/%E5%B0%86%E9%98%BF%E6%8B%89%E4%BC%AF%E6%95%B0%E5%AD%97%E8%BD%AC%E6%8D%A2%E6%88%90%E4%B8%AD%E6%96%87
周末在家,写了个小程序,用于将阿拉伯数字转换化大写中文。程序没经过任何优化,出没经过详细的测试,挂到网上,方便将来有需要的时候直接拿来用。
源码测试代码
#!/usr/bin/python
#-*- encoding: utf-8 -*-
import types
class NotIntegerError(Ex ...
- 2011-03-21 12:48
- 浏览 1002
- 评论(0)
js_自己封装一个可查询frame中对象的一个方法
- 博客分类:
- 原创
说明
用途: 查询当前页面以及所包含的frame中id为传入的参数的对象,如本身页面为frame,还可查询上级页面中id为传入参数的对象。
参数:可传入对象id,以及对象本身
返回:返回所传id的对象
用法:如查询id为javaeye的对象
var xx = $$('javaeye');
方法原码如下:
function $$(id){
if(typeof id == 'string'){
var obj = document.getElementById(id);
if(obj)return obj;
var p = ...
我们会有这样的需求:为了工程结构统层次清晰,在开发时不将工程定义为eclipse标准工程结构,如
|--src
|--java
|_-main
|--相关java源代码
|--docment
|--相关文档
|--resource
|--相关配置文件
|--database
|--数据库操作语句
|--webapp
|--WEB-INF
|--。。。。
这个时候,我们想在eclipse中运行这个工程,就必须指定工程wabapp的目录,操作步骤如下:
Servers--new serve ...
写了一个Http请求截取器,写Web时偶尔会用到。需要wxPython环境。点击下载
- 2010-12-10 16:28
- 浏览 1511
- 评论(0)