describe until scoring ancestors
This commit is contained in:
parent
193349c4fa
commit
1f66b5173f
1 changed files with 26 additions and 1 deletions
|
@ -149,10 +149,35 @@ let elementsToScore = [];
|
||||||
|
|
||||||
*** Часть 2
|
*** Часть 2
|
||||||
Скоринг (оценка) найденных полезных элементов
|
Скоринг (оценка) найденных полезных элементов
|
||||||
|
Цикл по elementsToScore
|
||||||
|
|
||||||
let candidates = [];
|
let candidates = [];
|
||||||
|
|
||||||
18.
|
18. Если у элемента нет родителя, либо родитель -- не элемент, то пропускаем; не понимаю смысла этой проверки, мы в любом случае искали внутри body, то есть родитель будет; а нода не является элементом и при этом может быть родителем (содержать элементы) только когда она -- документ; ну ладно
|
||||||
|
|
||||||
|
19. Если длина текста элемента меньше 25, то пропускаем
|
||||||
|
|
||||||
|
20. Ищем предков элемента (родителя, затем родителя родителя) максимум до 5 уровня, записываем в массив ancestors
|
||||||
|
|
||||||
|
21. Если в ancestors оказалось 0 элементов, пропускаем; аналогично -- не понимаю смысла проверки, если уже из пункта 18 мы точно знаем, что родитель есть
|
||||||
|
|
||||||
|
let contentScore = 1;
|
||||||
|
// Инициализируем переменную с баллами полезности элемента, базовое значение -- единица
|
||||||
|
|
||||||
|
22. Ищем количество запятых в тексте + 1 и прибавляем к contentScore
|
||||||
|
|
||||||
|
Примечание: выше сказано про +1 для полного соответствия этого описания с алгоритмом -- там делают .split по запятым и прибавляют длину массива к contentScore, а если вместо сплита матчить строку по запятым (искать вхождения), то результат будет на единицу меньше
|
||||||
|
|
||||||
|
Примечание: запятые бывают разные, в ридабилити применяют регулярку:
|
||||||
|
/\u002C|\u060C|\uFE50|\uFE10|\uFE11|\u2E41|\u2E34|\u2E32|\uFF0C/g
|
||||||
|
|
||||||
|
23. За каждые 100 символов текста прибавляем по баллу, максимум 3 раза (100-199 => 1; 200-299 => 2; 300-inf => 3; 400 => 3; 100500 => 3)
|
||||||
|
|
||||||
|
24. Цикл по массиву ancestors (пункт 20), содержащему предков элемента -- сначала родителя, потом родителя родителя, и так до 5-й "глубины":
|
||||||
|
|
||||||
|
24.1. Если текущая нода -- не элемент, либо у неё нет родителя, либо её родитель -- не элемент, то пропускаем
|
||||||
|
|
||||||
|
24.2. // line 1240
|
||||||
***
|
***
|
||||||
|
|
||||||
*** Часть 3
|
*** Часть 3
|
||||||
|
|
Loading…
Add table
Reference in a new issue