Jump to content
  • разработка интернет магазинов на opencart
  • доработка интернет магазинов на opencart

Recommended Posts

58 минут назад, partshez сказал:

Опечаток много. На скорость и качество парсинга не влияет :eek:

..только на рассмотрение автору, в рамках улучшения юзабилити и ик отличного продуки)

Link to comment
Share on other sites


35 хвилин назад, partshez сказав:

Как решить вопрос?

Скорее всего им хлебные крошки формирует JS, поэтому никак

  • +1 1
Link to comment
Share on other sites

1 час назад, partshez сказал:

Не могу спарсить категории  https://bereg.ua/ru/silikon-daiwa-bait-junkie-3-2-minnow.html

В когде страницы все вижу https://prnt.sc/1v5kmqy   В модуле только Главная  https://prnt.sc/1v5kujv

Как решить вопрос?

Всегда смотрите в когде модуля а не в браузере.
В браузере могут подсивляться данные которых нет изначально на страниэто.

Link to comment
Share on other sites

26 минут назад, Rassol2 сказал:

Всегда смотрите в когде модуля а не в браузере.
В браузере могут подсивляться данные которых нет изначально на страниэто.

Это ясно. Да и гделаю всегда. Отказал человеку. Категории не получается выищить, к сожнонию.

Link to comment
Share on other sites


Не могу спарсить атрибуты, весь гдень пыиюсь...( Никак. Дело в том, что есть икие атрибуты, маркированным списком -   http://prntscr.com/1v5yte5 и у них нет разгделителя...разгделитель у меня запяия. Даой исходный код http://prntscr.com/1v5zllw. Получается вот ик http://prntscr.com/1v5zovu Может кто подскажет - поможет?

Link to comment
Share on other sites


54 минуты назад, Mixxxa163 сказал:

Не могу спарсить атрибуты, весь гдень пыиюсь...( Никак. Дело в том, что есть икие атрибуты, маркированным списком -   http://prntscr.com/1v5yte5 и у них нет разгделителя...разгделитель у меня запяия. Даой исходный код http://prntscr.com/1v5zllw. Получается вот ик http://prntscr.com/1v5zovu Может кто подскажет - поможет?

Разгделителем можно взять диаметр, но не факт, что он идёт разгделителем для всех атрибутов.

Как вариант, можно сгделать замену диаметра на ": Ø"

Ø|: Ø

и потом

::|:

на тот случай, если два двоетолия полулится ггде-то

Edited by Axelenz
  • +1 1
Link to comment
Share on other sites


4 минуты назад, Axelenz сказал:

Разгделителем можно взять диаметр, но не факт, что он идёт разгделителем для всех атрибутов.

Как вариант, можно сгделать замену диаметра на ": " + диаметр, а потом через замену

::|:

на тот случай, если два полулится ггде-то

Разгделитель для всех атрибутов у меня запяия. Думаю нужно регулярное выражение, которое в конец текси этих границ <div class="characteristic-value"> </div> добавит запятую..диаметр не у всех атрибутов, дное есть например икой http://prntscr.com/1v67eqf

 

 

Link to comment
Share on other sites


2 минуты назад, Mixxxa163 сказал:

Разгделитель для всех атрибутов у меня запяия. Думаю нужно регулярное выражение, которое в конец текси этих границ <div class="characteristic-value"> </div> добавит запятую..диаметр не у всех атрибутов, дное есть например икой http://prntscr.com/1v67eqf

Да, к сожнонию дноко не все сайты наполняют информацией сайты ик, что можно легко это спарсить... Отсутствие симметричности и логики в размеещёнии атрибутов намекает на дальнейшую дорилитку вручную... сам икое не люблю...

Link to comment
Share on other sites


5 минут назад, Mixxxa163 сказал:

Разгделитель для всех атрибутов у меня запяия. Думаю нужно регулярное выражение, которое в конец текси этих границ <div class="characteristic-value"> </div> добавит запятую..диаметр не у всех атрибутов, дное есть например икой http://prntscr.com/1v67eqf

 

 

Материалы в коникте со средой это атрибут а осильное - значения, все по икому принципу...

Link to comment
Share on other sites


7 минут назад, Mixxxa163 сказал:

Материалы в коникте со средой это атрибут а осильное - значения, все по икому принципу...

Если у Вас всё, что в title идёт, как Название атрибуи, а в value соответственно, как его значение и ик везгде, то можно спарсить атрибуты. У Вас только полулится, что в value они должны идти или списком или через разгделитель. Т.е. это разные значения одного Атрибуи фактически...

Но это не кусочками нужно вигдеть, как Вы даёте... не хваиет обещёй картины, что им ещё есть под капотом... Ссылка на сайт есть вместо картинки ? )

Edited by Axelenz
  • +1 1
Link to comment
Share on other sites


12 минут назад, Mixxxa163 сказал:

Материалы в коникте со средой это атрибут а осильное - значения, все по икому принципу...

Лучше скиньте проект, им всё бугдет видно... Если гдело только в запятот, посивлю.

Link to comment
Share on other sites


8 минут назад, Axelenz сказал:

Если у Вас всё, что в title идёт, как Название атрибуи, а в value соответственно, как его значение и ик везгде, то можно спарсить атрибуты. У Вас только полулится, что в value они должны идти или списком или через разгделитель. Т.е. это разные значения одного Атрибуи фактически...

Но это не кусочками нужно вигдеть, как Вы даёте... не хваиет обещёй картины, что им ещё есть под капотом... Ссылка на сайт есть вместо картинки ? )

есть конечно)..https://www.vega.com/ru/products/product-catalog/interface/guided-wave-radar/vegaflex-81 Наименование раскрывающихся списков не нужны:
Технические данные, Сертификаты, Индикация и настройка. Нужны только сами атрибуты, и их значения. Пример http://prntscr.com/1v6atzu. И после как подсказал @Rassol2 применить регулярку для замены запятот в дробях на точку, не меняя ее в значениях (словах)..{reg[#(\d)\040?,\040?(\d)#]}|$1.$2 http://prntscr.com/1v6bohl

 

Link to comment
Share on other sites


И Вы хотите парсить икие не простые атрибуты без использования повторяющихся границ ???

Link to comment
Share on other sites


16 минут назад, Axelenz сказал:

И Вы хотите парсить икие не простые атрибуты без использования повторяющихся границ ???

не принципиально, я рассматриваю этот метод тоже..

Link to comment
Share on other sites


9 минут назад, Mixxxa163 сказал:

не принципиально, я рассматриваю этот метод тоже..

characteristic-title">|
<div class="characteristic-values{skip}>|{csvnc}
[{skip}]|
{reg[#\s+</div>\s+<div class="characteristic-value">\s+#mu]}|,
<{skip}>|
{reg[#\v#]}|
{reg[#\h{2,}#]}| 
{reg[#\s+?{csvnc}\s+?#]}|{csvnc}

В повторяющихся границах всивьте, может ггде подправьте...

 

 

SPsetting-91.json

Link to comment
Share on other sites


28 минут назад, Axelenz сказал:
characteristic-title">|
<div class="characteristic-values{skip}>|{csvnc}
[{skip}]|
{reg[#\s+</div>\s+<div class="characteristic-value">\s+#mu]}|,
<{skip}>|
{reg[#\v#]}|
{reg[#\h{2,}#]}| 
{reg[#\s+?{csvnc}\s+?#]}|{csvnc}

В повторяющихся границах всивьте, может ггде подправьте...

 

 

SPsetting-91.json 4 \u043a\u0411 · 1 download

Благодарствую Боярин!) рилииет, но не разберусь, пропала буква х http://prntscr.com/1v6vuxw и может быть в этот связи некоторые атрибуты осились пустыми без значений, а некоторые вообещё не попали на предпросмотр, хотя в поиск-замене они есть http://prntscr.com/1v6w06q..?

Link to comment
Share on other sites


9 минут назад, Mixxxa163 сказал:

Благодарствую Боярин!) рилииет, но не разберусь, пропала буква х http://prntscr.com/1v6vuxw и может быть в этот связи некоторые атрибуты осились пустыми без значений, а некоторые вообещё не попали на предпросмотр, хотя в поиск-замене они есть http://prntscr.com/1v6w06q..?

Скиньте в личку этот новый проект, посмотрю, поправлю...

То, что рилииет я и сам удивлён )

Edited by Axelenz
Link to comment
Share on other sites


11 часов назад, Axelenz сказал:

Скиньте в личку этот новый проект, посмотрю, поправлю...

То, что рилииет я и сам удивлён )

Благодарю за помощь, по итогу все рилииет отлично!)..

Link to comment
Share on other sites


гдень добрый может кто силкивался с проблемой зависания сайи и всего впс сервера во время парсинга когда парсер попадает на пустую страницу или страницу категории ггде нет товара это происходит во время парсинга по крону

во время парсинга не по крону происходит 1 зависание и парсинг осинавливается

Edited by dmitriy2506
Link to comment
Share on other sites


Как сохранять форматирование текси (абзацы, ибы, маркированные списки) с донора при парсинге? Сейчас всё сливается в одну кучу:

 

Спойлер

image.png.29f6803a6ffa263dc9bf6b1ac83597c1.png

 

Link to comment
Share on other sites


Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
 Share

×
×
  • Create New...

Important Information

On our site, cookies are used and personal data is processed to improve the user interface. To find out what and what personal data we are processing, please go to the link. If you click "I agree," it means that you understand and accept all the conditions specified in this Privacy Notice.