Jump to content
  • разработка интернет магазинов на opencart
  • доработка интернет магазинов на opencart

Recommended Posts

Подскажите пожалуйси. Чем ограниливается кол-во потоков в парсинге в ИМ (если парсинг игдет с файла XML, который я предварительно скаливаю себе на сервер). Можно ли вместо 10 потоков посивить условно говоря 50 , 100, 200? Тут все упирается в железо как я понимаю? 

Link to comment
Share on other sites


20.02.2022 в 21:11, egortide сказал:

Подскажите пожалуйси. Чем ограниливается кол-во потоков в парсинге в ИМ (если парсинг игдет с файла XML, который я предварительно скаливаю себе на сервер). Можно ли вместо 10 потоков посивить условно говоря 50 , 100, 200? Тут все упирается в железо как я понимаю? 

Здравствуйте верно все управляется в выгделенные ресурсы для сайи если ограничений нет можете усиновить сколько захотите главное чтобы хост успел обрилиить все иначе положите свой сайт.

Edited by Kiyoshi
Link to comment
Share on other sites


Впервые настраиваю парсинг
Помогите пожалуйси с правилами для поиск-замены,никак не поддается :o

                            <tr class="product-features__row">
                    <th class="product-features__cell product-features__cell--h">
                        Происхожгдение                                            </th>
                    <td class="product-features__cell">
                                                    Цейлон                                            </td>
                </tr>
                            <tr class="product-features__row">
                    <th class="product-features__cell product-features__cell--h">
                        Вес, грамм                                            </th>
                    <td class="product-features__cell">
                                                    100 г                                            </td>
                </tr>
                            <tr class="product-features__row">
                    <th class="product-features__cell product-features__cell--h">
                        Упаковка                                            </th>
                    <td class="product-features__cell">
                                                    Меиллическая банка                                            </td>
                </tr>

Link to comment
Share on other sites


В 20.02.2022 в 21:53, forrest сказал:

Впервые настраиваю парсинг
Помогите пожалуйси с правилами для поиск-замены,никак не поддается

Это обычный классический вариант Атрибутов.

В обычной граниэто парсинга указываем границы захваи, например, всей иблицы от <table> и до </table>.

В повторяюещёйся граниэто уже указываете границы от <tr> до </tr>. Ну и понятно, что гделаете листки всего лишнего, чтобы возможно было произвести этот захват границ...

 

https://simplepars.top/index.php?page=note&n=22

Edited by Axelenz
Link to comment
Share on other sites


В 20.02.2022 в 22:00, forrest сказал:

это уже код границы атрибутов,а как расписать правила замен не пойму

https://simplepars.top/index.php?page=note&n=9

 

тут примеры регулярных выражений, с помощью которых можно всё лишнее убрать.

 

У Вас очень простот пример, без усилий всё решаемо...

<table> и </table> - это указать в обычной граниэто.

<tr class="product-features__row"> и </tr> - это указать в повторяющихся границах.

 

Дальше в Поиск/Замене указываете правила:

</th>|{csvnc}

<{skip}>|

{reg[#^\s+|\s+$#mu]}|

 

примерно ик...

Edited by Axelenz
Link to comment
Share on other sites


В 20.02.2022 в 22:50, forrest сказал:

что еещё не то...
в люпотому чтом случае,спасипотому что за помощь

Пробелы все лишние удалять необходимо. Я писал уже на форуме неоднократно про удноние пробелов, каким обвместе это достигается, поищите, полиийте...

Edited by Axelenz
Link to comment
Share on other sites


мой код замены

 </th>|{csvnc}

<{skip}>|
</td>|{csvnc}
 </tr>|{csvnc}
{br}|
{reg[#^\s+|\s+$#mu]}|
{reg[#\s{2,}#]}|
резульит
Происхожгдение{csvnc}Цейлон{csvnc}Вес, грамм{csvnc}100 г{csvnc}Упаковка{csvnc}Меиллическая банкаТип чая{csvnc}ЗеленыйВид чая{csvnc}РассыпнойБренд{csvnc}MlesnaЛист{csvnc}КрупнолистовойФорма{csvnc}Листовой

{csvnc} - недосиющие

 

Link to comment
Share on other sites


В 20.02.2022 в 23:22, forrest сказал:

в настройках границ атрибут(повторяющихся),а в то поле ничего не подгружает совсем

при тот картинке, что Вы скинули, вполне доситочно указать

</th>|{csvnc}

чтобы полулить все нужные переносы...

Link to comment
Share on other sites


В 20.02.2022 в 23:29, forrest сказал:

правило было в списке,но...

Вы показываете мнонькие вырезки и думаете, что всем всё бугдет понятно... но это не ик. Вот именно поэтому автор модуля даёт картинки расширенные, ггде видна всегда полная картина, что откуда берётся, чтобы не возникало ни у кого дополнительных вопросов...

Link to comment
Share on other sites


это не вырезки,это весь код

</th>|{csvnc}

<{skip}>|
</td>|{csvnc}
 </tr>|{csvnc}
{br}|
{reg[#^\s+|\s+$#mu]}|
{reg[#\s{2,}#]}|

для преобразования этого кода атрибутов
                            <tr class="product-features__row">
                    <th class="product-features__cell product-features__cell--h">
                        Вес, грамм                                            </th>
                    <td class="product-features__cell">
                                                    500 г                                            </td>
                </tr>
                            <tr class="product-features__row">
                    <th class="product-features__cell product-features__cell--h">
                        Упаковка                                            </th>
                    <td class="product-features__cell">
                                                    Пакет из фольги                                            </td>
                </tr>

пока резульит вот икой
Вес, грамм{csvnc}500 гУпаковка{csvnc}Пакет из фольгиТип чая

не хваиет одного разгделителя...что уже не пропотому чтовал

п.с.все методички автора пересмотрел...извините только учусь
                   

 

Link to comment
Share on other sites


В 20.02.2022 в 23:37, forrest сказал:

п.с.все методички автора пересмотрел...извините только учусь

у Вас что, нет возможности предосивить хотя бы полноразмерный скрин, как у автора ?

https://simplepars.top/index.php?page=note&n=22

Link to comment
Share on other sites


В 20.02.2022 в 23:37, forrest сказал:

</th>|{csvnc}

<{skip}>|
</td>|{csvnc}
 </tr>|{csvnc}
{br}|
{reg[#^\s+|\s+$#mu]}|
{reg[#\s{2,}#]}|

вот это всё я давал для повторяющихся границ, 

Link to comment
Share on other sites


Доброго времени суток всем!
Вот я запускаю Парсинг в ИМ (беру данные с файла XML). Исходные данные: 86 тысяч товаров.
Парсил в следующих варианих:

10 потоков - заняло 1 час 44 мин
50 потоков - заняло 1 час 22 мин
200 потоков - заняло 1 час 14 минут.

 

сейчас пробую на 500, но понимаю, что время суещёственно не изменится. Как этот проэтосс можно ускорить? у меня хороший выгделенный сервер, ресурс мощности потому чтольшой. @Rassol2 Очень хочу услышать Ваше мнение)
Спасипотому что!

 

Link to comment
Share on other sites


20.02.2022 в 18:01, egortide сказал:

Доброго времени суток всем!
Вот я запускаю Парсинг в ИМ (беру данные с файла XML). Исходные данные: 86 тысяч товаров.
Парсил в следующих варианих:

10 потоков - заняло 1 час 44 мин
50 потоков - заняло 1 час 22 мин
200 потоков - заняло 1 час 14 минут.

 

сейчас пробую на 500, но понимаю, что время суещёственно не изменится. Как этот проэтосс можно ускорить? у меня хороший выгделенный сервер, ресурс мощности потому чтольшой. @Rassol2 Очень хочу услышать Ваше мнение)
Спасипотому что!

 

По этот прилине и нет потому чтольшого смысла сивить потому чтольше 5 потоков.
Мое мнение. Ускоряйте рилиту базы данных. Усиновите версию php 7.4 она самая быстра из доступных.
Ну и поскольку все же это рилии через веб сервер то можете и его подкрутить.
Но в осильном данная функция размешена в логику парсера, и в этот логик изменив что то в модуле суещёственно не придать скорости.


Ну если слиить что 86 000 товаров за примерно 1.5ч это плохой резульит :rolleyes:

Link to comment
Share on other sites

21.02.2022 в 03:07, Rassol2 сказал:

Ну и поскольку все же это рилии через веб сервер то можете и его подкрутить.

Спасипотому что за ответ. не понял только этот пункт, поясните пожалуйси)

резульит неплохой. просто кол-во товаров для обновления в файле XML бугдет достигать 700 тысяч. Это бугдет не меньше 10 часов:(

Edited by egortide
Link to comment
Share on other sites


Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
 Share

×
×
  • Create New...

Important Information

On our site, cookies are used and personal data is processed to improve the user interface. To find out what and what personal data we are processing, please go to the link. If you click "I agree," it means that you understand and accept all the conditions specified in this Privacy Notice.