首页 > 资讯 > 移动开发 >android 封装抓取网页信息的实例代码

799

分享到

android 封装抓取网页信息的实例代码

封装 Android 2022-06-06 10:06:49 799人浏览八月长安

摘要

代码如下:package cn.mypic; import java.io.BufferedInputStre

代码如下:
package cn.mypic;

    import java.io.BufferedInputStream;
    import java.io.BufferedReader;
    import java.io.File;
    import java.io.FileNotFoundException;
    import java.io.FileOutputStream;
    import java.io.IOException;
    import java.io.InputStreamReader;
    import java.net.MalfORMedURLException;
    import java.net.URL;
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;

    public class GetContentPicture {
    //得到了图片地址并下载图片
    public void gethtmlPicture(String HttpUrl) {
    URL url;
    BufferedInputStream in;
    FileOutputStream file;
    int count;                      //图片文件名序号
    FileNumber num=new FileNumber();//图片文件名序号类，num为对象
    count=num.NumberReadFromFile();//获取图片文件序号
    try {
    System.out.println("获取网络图片");
       String fileName = (String.valueOf(count)).concat(httpUrl.substring(httpUrl.lastIndexOf(".")));//图片文件序号加上图片的后缀名，后缀名用了String内的一个方法来获得
        //httpUrl.substring(httpUrl.lastIndexOf("/"));//这样获得的文件名即是图片链接里图片的名字
       String filePath = "d:/image/";//图片存储的位置
       url = new URL(httpUrl);
       in = new BufferedInputStream(url.openStream());
       file = new FileOutputStream(new File(filePath+fileName));
       int t;
       while ((t = in.read()) != -1) {
        file.write(t);
       }
       file.close();
       in.close();
       System.out.println("图片获取成功");
       count=count+1;//图片文件序号加1
       num.NumberWriteToFile(count);//将图片名序号保存
    } catch (MalformedURLException e) {
       e.printStackTrace();
    } catch (FileNotFoundException e) {
       e.printStackTrace();
    } catch (IOException e) {
       e.printStackTrace();
    }
    }
    //获取网页的代码保存在String格式的Content中
    public String getHtmlCode(String httpUrl) throws IOException {
    String content ="";
    URL uu = new URL(httpUrl); // 创建URL类对象
    BufferedReader ii = new BufferedReader(new InputStreamReader(uu
        .openStream())); // //使用openStream得到一输入流并由此构造一个BufferedReader对象
    String input;
    while ((inpu t = ii.readLine()) != null) { // 建立读取循环，并判断是否有读取值
       content += input;
    }
    ii.close();
    return content;
    }
    //分析网页代码，找到匹配的网页图片地址
    public void get(String url) throws IOException {
    String searchImgReg = "(?x)(src|SRC|background|BACKGROUND)=('|\")/?(([\\w-]+/)*([\\w-]+\\.(jpg|JPG|png|PNG|gif|GIF)))('|\")";//用于在网页代码Content中查找匹配的图片链接。
    String searchImgReg2 = "(?x)(src|SRC|background|BACKGROUND)=('|\")(http://([\\w-]+\\.)+[\\w-]+(:[0-9]+)*(/[\\w-]+)*(/[\\w-]+\\.(jpg|JPG|png|PNG|gif|GIF)))('|\")";
    String content = this.getHtmlCode(url);//this指对象GCp，在此地调用获取网页代码，getHtmlCode方法
    //System.out.println(content); //输出的content将是一个连续的字符串。
    Pattern pattern = Pattern.compile(searchImgReg);//java.util.regex.Pattern
    Matcher matcher = pattern.matcher(content);     //java.util.regex.Matcher
    while (matcher.find()) {
       System.out.println(matcher.group(3));//输出图片链接地址到屏幕
    // System.out.println(url);
       this.getHtmlPicture(matcher.group(3));//对象调用getHtmlPicture从网上下载并输出图片文件到指定目录
    }
    pattern = Pattern.compile(searchImgReg2);
    matcher = pattern.matcher(content);
    while (matcher.find()) {
       System.out.println(matcher.group(3));
       this.getHtmlPicture(matcher.group(3));
    }
    // searchImgReg =
    // "(?x)(src|SRC|background|BACKGROUND)=('|\")/?(([\\w-]+/)*([\\w-]+\\.(jpg|JPG|png|PNG|gif|GIF)))('|\")";
    }
    //主函数url网页的地址
    public static void main(String[] args) throws IOException {
    String url = "http://www.baidu.com";
    GetContentPicture gcp = new GetContentPicture();
    gcp.get(url);

    }
}

代码如下:
package cn.mypic;
    import java.io.*;
    public class FileNumber{
    //文件写
    public void NumberWriteToFile(int x){
       int c=0;
       c=x;
       File filePath=new File("d:/image");//文件名序号TXT文件保存地址
       File f1=new File(filePath,"number.txt");
       try{
        FileOutputStream fout=new FileOutputStream(f1);
        DataOutputStream out=new DataOutputStream(fout);
        out.writeInt(c);
       }
       catch(FileNotFoundException e){
        System.err.println(e);
       }
       catch(IOException e){
        System.err.println(e);
  &nb sp;    }
    }
    //文件读
    public int NumberReadFromFile(){
       int c1 = 0;
       File filePath=new File("d:/image");
       File f1=new File(filePath,"number.txt");
       try{
        FileInputStream fin=new FileInputStream(f1);
        DataInputStream in=new DataInputStream(fin);
        c1=in.readInt();
        System.out.println(c1);//输出文件内容至屏幕
       }
       catch(FileNotFoundException e){
        System.err.println(e);
       }
       catch(IOException e){
        System.err.println(e);
       }
       return c1;
    }
    public static void main(String args[]){
    }
}

您可能感兴趣的文章:Android控件封装自己封装的dialog控件浅析android中的线程封装Android封装的http请求实用工具类封装的android监听手指左右滑动屏幕的事件类分享Android支付宝支付封装代码Android开发之针对联系人的封装

--结束END--

本文标题: android 封装抓取网页信息的实例代码

本文链接: https://lsjlt.com/news/27552.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

android 封装抓取网页信息的实例代码

android 封装抓取网页信息的实例代码

Python抓取手机号归属地信息示例代码

Python抓取电影天堂电影信息的代码

Android Xutils3网络请求的封装详解及实例代码

Python爬虫实现网页信息抓取功能示例【URL与正则模块】

Phantomjs抓取渲染JS后的网页（Python代码）

Android获取apk程序签名信息代码示例

springcloud如何获取网关封装的头部信息

Android 获取屏幕的多种宽高信息的示例代码

Android封装实现短信验证码的获取倒计时

Node.js实现的简易网页抓取功能示例

node.js实现微信JS-API封装接口的示例代码

Android获取手机配置信息具体实现代码

Android封装怎么实现短信验证码的获取倒计时

Android获取手机的版本号等信息的代码

php实现的获取网站备案信息查询代码(360)

android获取当前接入点信息判断是ctwap还是ctnet实例代码

android通过okhttpClient下载网页内容的实例代码

Python 基于Selenium实现动态网页信息的爬取

vue3封装放大镜组件的实例代码

Mac清理软件cleanmymac x4.14.4破解版,2024年有免费cleanmymac x激活码

山东移动CM311-5-ZG_国科GK6323V100C_安卓4.4.2_免拆U盘卡刷刷机固件包

基于微信海南海口某健身房私教预约小程序系统设计与实现研究背景和意义、国内外现状

Android Studio常用快捷键、Android Studio快捷键大全

xcode15下载ios17模拟器失败

C51模拟CSGO的C4炸弹小程序

uniapp中video层级太高解决方案，适用安卓/IOS/H5

基于微信小程序化妆品商城系统设计与实现

Axios使用方法详解，从入门到进阶

微信小程序使用自定义tabbar 想要获取tabbar的高度,返回的结果是null,该如何获取?