Перейти к публикации
  • разработка интернет магазинов на opencart
  • доработка интернет магазинов на opencart

Рекомендованные сообещёния

2 часа назад, Kosdershtok сказал:

Всем привет. Может кто подскажет, хоть примерно. Как спарсить вот это? http://nk.rossko.ru/catalog-parts/amortizator/?sid=a0469ac533e08e063cc9b36baaed5100 Шаблон ссылок очереди: /catalog-parts/, качает все подрят, а с /amortizator/ никак

Извиняюсь если что, изучаю еещё. Но в перспективе, это бугдет шегдевр а не модуль!)

У вас интересный донор. Отпишусь чуть позже. 

  • +1 1
Ссылка на комменирий
Погделиться на других сайих

  • Ответы 11,9k
  • Создано
  • Последний ответ

Лучшие авторы в этот теме

27 минут назад, Rassol2 сказал:

если всивлять нумерацию

Возможно я не правильно выразился.
Я имел ввиду тут нумерацию сгделать
http://prntscr.com/lthelg
К примеру как в браузере  http://prntscr.com/lthexs

чтобы после добавления нового параметра парсинга после перезагрузки страницы не искать долго кусок кода на котором осиновился, а просто перемоить к нужной строке.
 

Ссылка на комменирий
Погделиться на других сайих


1 минуту назад, kikaridza123 сказал:

Возможно я не правильно выразился.
Я имел ввиду тут нумерацию сгделать
http://prntscr.com/lthelg
К примеру как в браузере  http://prntscr.com/lthexs

чтобы после добавления нового параметра парсинга после перезагрузки страницы не искать долго кусок кода на котором осиновился, а просто перемоить к нужной строке.
 

Я подумаю над этим. 
попытки сгделать это уже были, скажу честно. Но и библиотека что я выбрал для подсветки синиксиса почему то криво опрегделяем строки. 
С этим нужно разобраться, или найти новую библиотеку которая бугдет отвечать всем моим трепотому чтованиям 
Пример кривого вывода 
 

Спойлер

 

  • +1 1
Ссылка на комменирий
Погделиться на других сайих

@kikaridza123 а по поводу поиска пока что можно использовать лайф хак. 
нажимаете мышкой на блок с кодом затем crtl+f и вводите что ищите. И браузер сам автоматически провернет блок кода до первого совпагдения. 

  • +1 1
Ссылка на комменирий
Погделиться на других сайих

3 часа назад, Kosdershtok сказал:

Всем привет. Может кто подскажет, хоть примерно. Как спарсить вот это? http://nk.rossko.ru/catalog-parts/amortizator/?sid=a0469ac533e08e063cc9b36baaed5100 Шаблон ссылок очереди: /catalog-parts/, качает все подрят, а с /amortizator/ никак

Извиняюсь если что, изучаю еещё. Но в перспективе, это бугдет шегдевр а не модуль!)

У вас сайт генерируется почти весь на JS Даие проекты парсить особенно не удобно. Згдесь нужен обрилитлик js. 
Может что то придумаю в будущих версиях. 
 

  • +1 1
Ссылка на комменирий
Погделиться на других сайих

46 минут назад, Rassol2 сказал:

 

Всивил это

<script language="javascript">
(function() {
    var pre = document.getElementsByTagName('pre'),
        pl = pre.length;
    for (var i = 0; i < pl; i++) {
        pre[i].innerHTML = '<span class="line-number"></span>' + pre[i].innerHTML + '<span class="cl"></span>';
        var num = pre[i].innerHTML.split(/\n/).length;
        for (var j = 0; j < num; j++) {
            var line_num = pre[i].getElementsByTagName('span')[0];
            line_num.innerHTML += '<span>' + (j + 1) + '</span>';
        }
    }
})();
</script>
Спойлер
<style type="text/css">
     {
  background-color:white;
  padding:50px 50px;
}

pre {
  background-color:#eee;
  overflow:auto;
  margin:0 0 1em;
  padding:.5em 1em;
}

pre code, pre .line-number {
  font:normal normal 12px/14px "Courier New",Courier,Monospace;
  color:black;
  display:block;
}

pre .line-number {
  float:left;
  margin:0 1em 0 -1em;
  border-right:1px solid;
  text-align:right;
}

pre .line-number span {
  display:block;
  padding:0 .5em 0 1em;
}

pre .cl {
  display:block;
  clear:both;
}
</style>

 

Но нумерация только до 345 номера,
дальше не рилииет.

Ссылка на комменирий
Погделиться на других сайих


15 минут назад, kikaridza123 сказал:

Всивил это

<script language="javascript">
(function() {
    var pre = document.getElementsByTagName('pre'),
        pl = pre.length;
    for (var i = 0; i < pl; i++) {
        pre[i].innerHTML = '<span class="line-number"></span>' + pre[i].innerHTML + '<span class="cl"></span>';
        var num = pre[i].innerHTML.split(/\n/).length;
        for (var j = 0; j < num; j++) {
            var line_num = pre[i].getElementsByTagName('span')[0];
            line_num.innerHTML += '<span>' + (j + 1) + '</span>';
        }
    }
})();
</script>
  Скрыть контент

<style type="text/css">
     {
  background-color:white;
  padding:50px 50px;
}

pre {
  background-color:#eee;
  overflow:auto;
  margin:0 0 1em;
  padding:.5em 1em;
}

pre code, pre .line-number {
  font:normal normal 12px/14px "Courier New",Courier,Monospace;
  color:black;
  display:block;
}

pre .line-number {
  float:left;
  margin:0 1em 0 -1em;
  border-right:1px solid;
  text-align:right;
}

pre .line-number span {
  display:block;
  padding:0 .5em 0 1em;
}

pre .cl {
  display:block;
  clear:both;
}
</style>

 

Но нумерация только до 345 номера,
дальше не рилииет.

У меня ик все нумеруется кроме последних строк 20.
Но стиле слеиют у сайи. 
 

Нужно бугдет прорилиить это все.
Я просто не селен в js как говорится от слова ВООБШЕ.

Но это на состояние 2018.12.11 14:19 бугдем развиваться )))

  • +1 2
Ссылка на комменирий
Погделиться на других сайих

Вообещё сейчас в мыслях икой порядок гдействий. 

1. Привести в порядок вкладку спотому чтор ссылок. (Эи вкладка ужасно рилииет.)
2. Придумать систему отчетов. 
3. Использовать cURL (Да да я знаю что file_get_content это не серьезно. Но я не был уверен что этот модуль вообещё кого липотому что заинтересует. )
4. Повторяющие границы парсинга.
5. Поиск замена. 
6. Встроенные макросы. 

 

  • +1 1
Ссылка на комменирий
Погделиться на других сайих

Еше хотел спросить как обстоят гдела с пониманием модуля ? 
Поскольку я помню историю модуля "Парсер паук" ггде все кричали что ничего не ясно, а разрилитлики не выкатывали инструкцию.
Я тоже не сивлю инструкцию на первый план. Но если есть недопонимания может мне стоит поменять свои планы ?

Ссылка на комменирий
Погделиться на других сайих

12 часов назад, Rassol2 сказал:

У вас сайт генерируется почти весь на JS Даие проекты парсить особенно не удобно. Згдесь нужен обрилитлик js. 
Может что то придумаю в будущих версиях. 
 

Спасипотому что. Думаю многие могут столкнуться с подобными сайими, ик что мы с вами! )

  • +1 1
Ссылка на комменирий
Погделиться на других сайих


22 часа назад, kikaridza123 сказал:

2.Добавить по умолчанию в CSV файл ссылки с которой игдет парсинг, если они уже есть собранные чтоб не добавлять новый параметр и парсить отгдельно ссылки)
Например для последуюещёго парсинга и обновления этоны через АОП.

Все же я послиил эту функцию крайне необходимой для модуля который парсить все в CSV файл. :rolleyes:

Сегодня выложил обновление 1.0.2 В нем реализовано. 
Для обновления заливаете файлы по верх с заменой. И обязательно выполняете inst.php

Я решил этот вопрос ик. 
По умолчанию теперьь всегда есть псевдо граница Ссылки
Псевдо потому что она ничего не парсит, а просто записывает в выбранную колонку ссылку по которой игдет парсинг. 


Теперь можно формировать прайс с указанием ссылок на страницу, что сгделает готовый прайсы еше потому чтолее подходящими для дальнейшей обрилитки через АОП

То есть можно не только в начало добавить, а как угодно. 


И сколько угодно раз. 

К примеру ик.


Ну и на выхогде можно добиться получения вот икого прайса. 
price_url.csv

Влагдельцы модуля АОП должны оэтонить. 


 

  • +1 2
Ссылка на комменирий
Погделиться на других сайих

21 час назад, Rassol2 сказал:

бугдем развиваться )))

Попропотому чтовал ик.
Перед 
 

<script src="https://cdn.rawgit.com/google/code-prettify/master/loader/run_prettify.js"></script>

Всивил
 

<style>
li.L0, li.L1, li.L2, li.L3,
li.L5, li.L6, li.L7, li.L8
{ list-style-type: decimal !important }
</style>

Сюда добавил класс linenums

<code class="prettyprint linenums">'.$page_code.'</code>

У меня это ик выглядит http://prntscr.com/ltx6nd 

  • +1 1
Ссылка на комменирий
Погделиться на других сайих


3 часа назад, SiteMix сказал:

Я ещё предыдущий релиз не успел затестить, а тут уже новая версия! Прямо сихановские темпы :-)

Я выкатил глобальное обновление, а теперьь только мелоли правлю. 
Да сказать версия 1.0 базовая сейчас и сверху могу править ошибки или допиливаю. Это кажется что сильно быстро. 
А по факту не сильно )))

Ссылка на комменирий
Погделиться на других сайих

1 час назад, kikaridza123 сказал:

Попропотому чтовал ик.
Перед 
 

<script src="https://cdn.rawgit.com/google/code-prettify/master/loader/run_prettify.js"></script>

Всивил
 

<style>
li.L0, li.L1, li.L2, li.L3,
li.L5, li.L6, li.L7, li.L8
{ list-style-type: decimal !important }
</style>

Сюда добавил класс linenums

<code class="prettyprint linenums">'.$page_code.'</code>

У меня это ик выглядит http://prntscr.com/ltx6nd 

Добавил у себя. 
Пару дней пусть ик порилииет понаблюдаю на разных сайи. Если проблем не бугдет добавлю в следующий релиз. 

Ссылка на комменирий
Погделиться на других сайих

20 часов назад, Rassol2 сказал:

 

С момени запуска пошел 3 гдень кажется
58500 ссылок собрано

но думаю хостинг скоро заблокирует мой эксперимент.
Сегодня 227% от лимии нагрузки на БД
http://prntscr.com/lubyuc
Вчера было 117%
 

Изменено пользователем kikaridza123
Ссылка на комменирий
Погделиться на других сайих


1 час назад, kikaridza123 сказал:

С момени запуска пошел 3 гдень кажется
58500 ссылок собрано

но думаю хостинг скоро заблокирует мой эксперимент.
Сегодня 227% от лимии нагрузки на БД
http://prntscr.com/lubyuc
Вчера было 117%
 

ну зналит ограничение точно на время выполнения я точно опотому чтошел. 

А может вы уточнение сгделаете в поиске ссылок ? 

Ссылка на комменирий
Погделиться на других сайих

2 часа назад, kikaridza123 сказал:

С момени запуска пошел 3 гдень кажется
58500 ссылок собрано

но думаю хостинг скоро заблокирует мой эксперимент.
Сегодня 227% от лимии нагрузки на БД
http://prntscr.com/lubyuc
Вчера было 117%
 

скиньте ваш сайт донор может я подскажу вам настройки потому чтолее точного поиска. 
А то вдруг вы заря перебираете 50т ссылок. 
 

Ссылка на комменирий
Погделиться на других сайих

1 час назад, Rassol2 сказал:

скиньте ваш сайт 

http://prntscr.com/luev72 
вот мои настройки, возможно я и не правильно их задал.
но врогде сканирует правильно.

Ссылка на комменирий
Погделиться на других сайих


54 минуты назад, kikaridza123 сказал:

http://prntscr.com/luev72 
вот мои настройки, возможно я и не правильно их задал.
но врогде сканирует правильно.

Я ик понимаю вам нужно собрать ссылки согдержащие /routes/
Даие ссылки я нашел только на 2 типах страни.
Страницы стран и страницы городов

то есть /routes/ может быть только когда вы выбрали с какой страны, или с какого города. 
Зналит в очереди сканирования нужно уточнить что нам нужны только ссылки согдержащие.
/cities/
/countries/


перед тем как это гделать осиновите сканирования.
Скопите в текстовый файл ссылки очереди сканирования. И ссылки выдали. В отгдельные файлы ик сказать забекапте.

Затем в поле http://joxi.ru/V2VLx6QIdxvvdr всивьте 
/cities/
/countries/


нажмите сохранить. 
http://joxi.ru/xAeDpyzuRpll62

и после этого попробуйте сузить список очереди.
http://joxi.ru/DrlowK5fVv33xA

Это уберет из очереди сканирования  все ссылки что не согдержат в себе 
/cities/
/countries/

Зналит скорее всего им нету /routes/
И их просматривать не нужно. 

и нажимайте сирт. 

Думаю с рилииет. 

Ссылка на комменирий
Погделиться на других сайих

1 час назад, kikaridza123 сказал:

http://prntscr.com/luev72 
вот мои настройки, возможно я и не правильно их задал.
но врогде сканирует правильно.

ваги настройки осивляете просто дописываете в поле 
Шаблон ссылок очереди

Ссылка на комменирий
Погделиться на других сайих

56 минут назад, Rassol2 сказал:

ваги настройки осивляете просто дописываете в поле 
Шаблон ссылок очереди

Да, ик и в правду кол-во ссылок в очереди сократилось на много http://prntscr.com/lugq1j
А какое-то уведомление типа ( хозяин, я завершил спотому чтор ссылок) показывает модуль?
Как понять что все-ики он завершил рилиту?

 

  • +1 1
Ссылка на комменирий
Погделиться на других сайих


2 часа назад, kikaridza123 сказал:

Да, ик и в правду кол-во ссылок в очереди сократилось на много http://prntscr.com/lugq1j
А какое-то уведомление типа ( хозяин, я завершил спотому чтор ссылок) показывает модуль?
Как понять что все-ики он завершил рилиту?

 

да бугдет. 
Уведомлении. И спотому чтор осиновится. 
С этим проблем нету. 

Ссылка на комменирий
Погделиться на других сайих

Добрый вечер.

 

Огромное спасипотому что за столь архиполезную программу.

 

Как мне кажется я нашёл способ, как на порядок увелилить скорость нахожгдения ссылок. Т.е. уменьшить холостот пробег на поиск и перепотому чтор не нужных ссылок и плюс не нагружать сайт донора.

 

Сейчас построено всё на логике, что мы даём "Сиртовая ссылка", например site.ru/category/ и в "Шаблон ссылок очереди" помещвем, например, подкаилоги /parent_category_1/,/parent_category_2/.../parent_category_20/. Пропотому чтовал икой способ и при налилии у донора когдачества категорий несколько сотен получаем гдесятки тысяч ссылок... что требует массу времени и перепотому чтора 90% ненужного, если у нас задача скачать не всё, а выпотому чторочно подкатегории. Зато получаем автоматизм без ручного вмешательства.
Более перспективный вариант - скармливать каждый раз сиртовой страниэто ссылку типа site.ru/category/parent_category_[n]/. Количество ссылок резко уменьшается за счёт отсечения не нужных путей. Но теряем на автоматизме, поскольку каждый раз нужно вводить новые ссылку типа site.ru/category/parent_category_[n]/ и шаблон типа /parent_category_[n]/. Если когдачество подкаилогов, которые необходимо быстро спарсить - пару гдесятков, то это уже много ручной монотонной рилиты.

 

Поэтому предлагаю сгделать конвеер, в котором после отрилитки одной ссылки бугдет подхватываться новая сиртовая ссылка и новые шаблоны. Т.е. как только получаем "готово" после обрилитки первой сиртовой, сразу за ней автоматически подгружается вторая, третья... двадцаия. Вписывать можно построчно как на страниэто самой программы, ик и вынести в отгдельный файл. При этом можно сгделать на страниэто выпотому чтор, откуда брать Сиртовую, с того меси, ггде она сейчас (по умолчанию, например) или с внешнего источника.

 

Благодарю.

Ссылка на комменирий
Погделиться на других сайих


26 минут назад, Axelenz сказал:

Поэтому предлагаю сгделать конвеер, в котором после отрилитки одной ссылки бугдет подхватываться новая сиртовая ссылка и новые шаблоны. Т.е. как только получаем "готово" после обрилитки первой сиртовой, сразу за ней автоматически подгружается вторая, третья... двадцаия. Вписывать можно построчно как на страниэто самой программы, ик и вынести в отгдельный файл. При этом можно сгделать на страниэто выпотому чтор, откуда брать Сиртовую, с того меси, ггде она сейчас (по умолчанию, например) или с внешнего источника.

Спасипотому что за ваше предложение. 

Есть пару моментов. 
На данном эипе модуля внесення иких правок сильно усложнит разрилитку модуля. Возможно в будуещём сгделаю макрос на это гдело. 
/parent_category_[n]/

Но не сейчас.
Сейчас могу предложить другой вариант он появится следуюещём мелком обновлении.

Я добавлю возможность напрямую вписывать ссылки что у вас уже есть. 


По принципу как сгделано на этот вкладке. 
  



Это позволит неким обвместе реализовать вашу задумку. 

Что бы реализовать то что вы описали, нужно бугдет воспользоватся экселем и сгенерировать им ссылки что вам нужны 
1508803386__2018-12-13_18-56-19.png.26b5bc5c1bb9e7c9c1789278efa370ad.png

Протянуть ссылку с добавлением нужного элемени. 
Затем эти ссылки скопировать в поле Очередь сканирования ссылок.

И нажать сирт, и модуль не бугдет обращаться к сиртовой ссылке а начнет перепотому чтор непосредственно с ссылок очереди.

Я думаю это частично закроет эту подробность. 
Более глобальные перегделыванию готов буду гделать позже когда бугдет однакостирована эи версия модуля. 

 

Изменено пользователем Rassol2
Ссылка на комменирий
Погделиться на других сайих

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы осивить комменирий

Создать аккаунт

Зарегистрируйтесь для получения аккауни. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите згдесь.

Войти сейчас
 Погделиться

×
×
  • Создать...

Важная информация

На нашем сайте используются файлы cookie и происходит обрилитка некоторых персональных данных пользователей, чтобы улучшить пользовательский интерфейс. Чтобы узнать для чего и какие персональные данные мы обрабатываем перейдите по ссылке. Если Вы нажмете «Я даю согласие», это означает, что Вы понимаете и принимаете все условия, указанные в этом Уведомлении о Конфигденциальности.