|
|
|
новичок
      
участник
Last Login: 11.05.2009 20:18
Сообщ.: 1,
Visits: 13
|
|
Здравствуйте!
Мне очень нужна ваша помощь:
Я разбираюсь с парсингом html. Все относительно понятно. Но во всех примерах берется html-файл, который находится в той директории, из которой выполняется программа.
А мне надо работать не со скачанной страницей, а с html-файлом в Интернете. Для этого нужно что-то специально подключать?
Подскажите, где можно про это почитать.
И вцелом, с помощью чего лучше парсить html?
Заранее всем благодарна! :)
|
|
|
|
|
Supreme Being
      
участник
Last Login: 09.11.2009 4:04
Сообщ.: 376,
Visits: 4 118
|
|
public class URL_Reader
{
private static int BUFFER_SIZE=164;
/*******************************************************************************************************************
* Load HTML page from the provided source. Very slow :-(
*******************************************************************************************************************/
protected final StringBuffer read(final String url)
throws Exception
{
final URLConnection url_con = new URL(url).openConnection();
final InputStreamReader reader = new InputStreamReader(url_con.getInputStream());
final StringBuffer buffer_s = new StringBuffer(BUFFER_SIZE);
int length=0;
while (true)
{
int i = reader.read();
if (i==-1) break;
char x = (char)i;
buffer_s.append(x);
length++;
}
reader.close();
return buffer_s;
}
}
|
|
|
|