Парсер Хабра: Численная проверка abc-гипотезы (да, той самой)

суббота, 20 октября 2018 г.

Численная проверка abc-гипотезы (да, той самой)

Привет habr.

На ~~geektimes~~ habr было уже несколько статей про abc-гипотезу (например в 2013 и в 2018 годах). Сама история про теорему, которую сначала много лет не могут доказать, а потом столько же лет не могут проверить, безусловно заслуживает как минимум, художественного фильма. Но в тени этой чудесной истории, сама теорема рассматривается черезчур поверхностно, хотя она не менее интересна. Уже хотя бы тем, что abc-гипотеза — одна из немногих нерешенных проблем современной науки, постановку задачи которой сможет понять даже пятиклассник. Если же эта гипотеза действительно верна, то из нее легко следует доказательство других важных теорем, например доказательство теоремы Ферма.

Не претендуя на лавры Мотидзуки, я ~~тоже решил попробовать~~ решил проверить с помощью компьютера, насколько выполняются обещанные в гипотезе равенства. Собственно, почему бы нет — современные процессоры ведь не только для того чтобы в игры играть — почему бы не использовать компьютер по своему основному (compute — вычислять) предназначению…

Кому интересно что получилось, прошу под кат.

Постановка задачи

Начнем с начала. О чем собственно, теорема? Как гласит Википедия (формулировка в английской версии немного более понятна), для взаимно-простых (не имеющих общих делителей) чисел a, b и с, таких что a+b=c, для любого ε>0 существует ограниченное число троек a+b=c, таких что:

Функция rad называется радикалом, и обозначает произведение простых множителей числа. Например, rad(16) = rad(2*2*2*2) = 2, rad(17) = 17 (17 простое число), rad(18) = rad(2*3*3) = 2*3 = 6, rad(1000000) = rad(2^6 ⋅ 5^6) = 2*5 = 10.

Собственно, суть теоремы в том, что количество таких троек довольно мало. Например, если взять наугад ε=0.2 и равенство 100+27=127: rad(100) = rad(2*2*5*5) = 10, rad(27)=rad(3*3*3)=3, rad(127) = 127, rad(a*b*c) = rad(a)*rad(b)*rad(с) = 3810, 3810^1.2 явно больше 127, неравенство не выполняется. Но бывают и исключения, например для равенства 49 + 576 = 625 условие теоремы выполняется (желающие могут проверить самостоятельно).

Следующий ключевой для нас момент — этих равенств, согласно теореме, ограниченное число. Т.е. это значит, что их все можно просто попытаться перебрать на компьютере. В итоге, это дает нам ~~Нобелевскую премию~~ вполне интересную задачу по программированию.

Итак, приступим.

Исходный код

Первая версия была написана на Python, и хотя этот язык слишком медленный для подобных расчетов, писать код на нем легко и просто, что удобно для прототипирования.

Получение радикала: раскладываем число на простые множители, затем убираем повторы, преобразуя массив в множество. Затем просто получаем произведение всех элементов.

def prime_factors(n):
    factors = []
    # Print the number of two's that divide n
    while n % 2 == 0:
        factors.append(int(2))
        n = n / 2

    # n must be odd at this point so a skip of 2 ( i = i + 2) can be used
    for i in range(3, int(math.sqrt(n)) + 1, 2):
        # while i divides n , print i ad divide n
        while n % i == 0:
            factors.append(int(i))
            n = n / i

    # Condition if n is a prime number greater than 2
    if n > 2:
        factors.append(int(n))
    return set(factors)

def rad(n):
    result = 1
    for num in prime_factors(n):
         result *= num
    return result

Взаимно-простые числа: раскладываем числа на множители, и просто проверяем пересечение множеств.

def not_mutual_primes(a,b,c):
    fa, fb, fc = prime_factors(a), prime_factors(b), prime_factors(c)
    return len(fa.intersection(fb)) == 0 and len(fa.intersection(fc)) == 0 and len(fb.intersection(fc)) == 0

Проверка: используем уже созданные функции, тут все просто.

def check(a,b,c):
    S = 1.2  # Eps=0.2
    if c > (rad(a)*rad(b)*rad(c))**S and not_mutual_primes(a, b, c):
        print("{} + {} = {} - PASSED".format(a, b, c))
    else:
        print("{} + {} = {} - FAILED".format(a, b, c))

check(10, 17, 27)
check(49, 576, 625)

Желающие могут поэкспериментировать самостоятельно, скопировав вышеприведенный код в любой онлайн-редактор языка Python. Разумеется, код работает ожидаемо медленно, и перебор всех троек хотя бы до миллиона был бы слишком долгим. Ниже под спойлером есть оптимизированная версия, рекомендуется использовать ее.

Окончательная версия была переписана на С++ с использованием многопоточности и некоторой оптимизации (работать на Си с пересечением множеств было бы слишком хардкорно, хотя вероятно и быстрее). Исходный код под спойлером, его можно скомпилировать в бесплатном компиляторе g++, код работает под Windows, OSX и даже на Raspberry Pi.

Код на С++

// To compile: g++ abc.cpp -O3 -fopenmp -oabc

#include <string.h>
#include <math.h>
#include <stdbool.h>
#include <stdint.h>
#include <stdio.h>
#include <vector>
#include <set>
#include <map>
#include <algorithm>
#include <time.h>

typedef unsigned long int valType;
typedef std::vector<valType> valList;
typedef std::set<valType> valSet;
typedef valList::iterator valListIterator;

std::vector<valList> valFactors;
std::vector<double> valRads;

valList factors(valType n) {
  valList results;
  valType z = 2;
  while (z * z <= n) {
    if (n % z == 0) {
      results.push_back(z);
      n /= z;
    } else {
      z++;
    }
  }
  if (n > 1) {
    results.push_back(n);
  }
  return results;
}

valList unique_factors(valType n) {
  valList results = factors(n);
  valSet vs(results.begin(), results.end());
  valList unique(vs.begin(), vs.end());
  std::sort(unique.begin(), unique.end());
  return unique;
}

double rad(valType n) {
  valList f = valFactors[n];
  double result = 1;
  for (valListIterator it=f.begin(); it<f.end(); it++) {
      result *= *it;
  }
  return result;
}

bool not_mutual_primes(valType a, valType b, valType c) {
  valList res1 = valFactors[a], res2 = valFactors[b], res3; // = valFactors[c];
  valList c12, c13, c23;
  set_intersection(res1.begin(),res1.end(), res2.begin(),res2.end(), back_inserter(c12));
  if (c12.size() != 0) return false;
  res3 = valFactors[c];
  set_intersection(res1.begin(),res1.end(), res3.begin(),res3.end(), back_inserter(c13));
  if (c13.size() != 0) return false;
  set_intersection(res2.begin(),res2.end(), res3.begin(),res3.end(), back_inserter(c23));
  return c23.size() == 0;
}

int main()
{
  time_t start_t, end_t;
  time(&start_t);
  
  int cnt=0;
  double S = 1.2;
  valType N_MAX = 10000000;
  
  printf("Getting prime factors...\n");
  
  valFactors.resize(2*N_MAX+2);
  valRads.resize(2*N_MAX+2);
  for(valType val=1; val<=2*N_MAX+1; val++) {
      valFactors[val] = unique_factors(val);
      valRads[val] = rad(val);
  }
  
  time(&end_t);
  printf("Done, T = %.2fs\n", difftime(end_t, start_t));
  
  printf("Calculating...\n");
  #pragma omp parallel for reduction(+:cnt)
  for(int a=1; a<=N_MAX; a++) {
    for(int b=a; b<=N_MAX; b++) {
      int c = a+b;
      if (c > pow(valRads[a]*valRads[b]*valRads[c], S) && not_mutual_primes(a,b,c)) {
        printf("%d + %d = %d\n", a,b,c);
        cnt += 1;
      }
    }
  }
  printf("Done, cnt=%d\n", cnt);
  
  time(&end_t);
  float diff_t = difftime(end_t, start_t);
  printf("N=%lld, T = %.2fs\n", N_MAX, diff_t);
}

Для тех кому лень устанавливать компилятор С++, приведена слегка оптимизированная Python-версия, запустить которую можно в любом онлайн редакторе (я использовал https://repl.it/languages/python).

Python-версия

from __future__ import print_function
import math
import time
import multiprocessing

prime_factors_list = []
rad_list = []

def prime_factors(n):
    factors = []
    # Print the number of two's that divide n
    while n % 2 == 0:
        factors.append(int(2))
        n = n / 2

    # n must be odd at this point so a skip of 2 ( i = i + 2) can be used
    for i in range(3, int(math.sqrt(n)) + 1, 2):
        # while i divides n , print i ad divide n
        while n % i == 0:
            factors.append(int(i))
            n = n / i

    # Condition if n is a prime number greater than 2
    if n > 2:
        factors.append(int(n))
    return factors

def rad(n):
    result = 1
    for num in prime_factors_list[n]:
         result *= num
    return result

def not_mutual_primes(a,b,c):
    fa, fb, fc = prime_factors_list[a], prime_factors_list[b], prime_factors_list[c]
    return len(fa.intersection(fb)) == 0 and len(fa.intersection(fc)) == 0 and len(fb.intersection(fc)) == 0

def calculate(N):
    S = 1.2
    cnt = 0
    for a in range(1, N):
        for b in range(a, N):
            c = a+b
            if c > (rad_list[a]*rad_list[b]*rad_list[c])**S and not_mutual_primes(a, b, c):
                print("{} + {} = {}".format(a, b, c))
                cnt += 1

    print("N: {}, CNT: {}".format(N, cnt))
    return cnt

if __name__ == '__main__':

    t1 = time.time()

    NMAX = 100000
    prime_factors_list = [0]*(2*NMAX+2)
    rad_list = [0]*(2*NMAX+2)
    for p in range(1, 2*NMAX+2):
        prime_factors_list[p] = set(prime_factors(p))
        rad_list[p] = rad(p)
    
    calculate(NMAX)

    print("Done", time.time() - t1)

Результаты

Троек a,b,c действительно очень мало.

Некоторые результаты приведены ниже:
N=10: 1 «тройка», время выполнения <0.001c
1 + 8 = 9

N=100: 2 «тройки», время выполнения <0.001c
1 + 8 = 9
1 + 80 = 81

N=1000: 8 «троек», время выполнения <0.01c
1 + 8 = 9
1 + 80 = 81
1 + 242 = 243
1 + 288 = 289
1 + 512 = 513
3 + 125 = 128
13 + 243 = 256
49 + 576 = 625

N=10000: 23 «тройки», время выполнения 2с

Тройки A,B,C до 10000

1 + 8 = 9 1 + 80 = 81 1 + 242 = 243 1 + 288 = 289 1 + 512 = 513 1 + 2400 = 2401 1 + 4374 = 4375 1 + 5831 = 5832 1 + 6560 = 6561 1 + 6655 = 6656 1 + 6859 = 6860 3 + 125 = 128 5 + 1024 = 1029 10 + 2187 = 2197 11 + 3125 = 3136 13 + 243 = 256 49 + 576 = 625 1331 + 9604 = 10935 81 + 1250 = 1331 125 + 2187 = 2312 243 + 1805 = 2048 289 + 6272 = 6561 625 + 2048 = 2673

N=100000: 53 «тройки», время выполнения 50c

Тройки A,B,C до 100000

1 + 8 = 9 1 + 80 = 81 1 + 242 = 243 1 + 288 = 289 1 + 512 = 513 1 + 2400 = 2401 1 + 4374 = 4375 1 + 5831 = 5832 1 + 6560 = 6561 1 + 6655 = 6656 1 + 6859 = 6860 1 + 12167 = 12168 1 + 14336 = 14337 1 + 57121 = 57122 1 + 59048 = 59049 1 + 71874 = 71875 3 + 125 = 128 3 + 65533 = 65536 5 + 1024 = 1029 7 + 32761 = 32768 9 + 15616 = 15625 9 + 64000 = 64009 10 + 2187 = 2197 11 + 3125 = 3136 13 + 243 = 256 28 + 50625 = 50653 31 + 19652 = 19683 37 + 32768 = 32805 49 + 576 = 625 49 + 16335 = 16384 73 + 15552 = 15625 81 + 1250 = 1331 121 + 12167 = 12288 125 + 2187 = 2312 125 + 50176 = 50301 128 + 59049 = 59177 169 + 58880 = 59049 243 + 1805 = 2048 243 + 21632 = 21875 289 + 6272 = 6561 343 + 59049 = 59392 423 + 16384 = 16807 507 + 32768 = 33275 625 + 2048 = 2673 1331 + 9604 = 10935 1625 + 16807 = 18432 28561 + 89088 = 117649 28561 + 98415 = 126976 3584 + 14641 = 18225 6561 + 22000 = 28561 7168 + 78125 = 85293 8192 + 75843 = 84035 36864 + 41261 = 78125

При N=1000000 имеем всего лишь 102 «тройки», полный список приведен под спойлером.

Тройки A,B,C до 1000000

1 + 8 = 9 1 + 80 = 81 1 + 242 = 243 1 + 288 = 289 1 + 512 = 513 1 + 2400 = 2401 1 + 4374 = 4375 1 + 5831 = 5832 1 + 6560 = 6561 1 + 6655 = 6656 1 + 6859 = 6860 1 + 12167 = 12168 1 + 14336 = 14337 1 + 57121 = 57122 1 + 59048 = 59049 1 + 71874 = 71875 1 + 137780 = 137781 1 + 156249 = 156250 1 + 229375 = 229376 1 + 263168 = 263169 1 + 499999 = 500000 1 + 512000 = 512001 1 + 688127 = 688128 3 + 125 = 128 3 + 65533 = 65536 5 + 1024 = 1029 5 + 177147 = 177152 7 + 32761 = 32768 9 + 15616 = 15625 9 + 64000 = 64009 10 + 2187 = 2197 11 + 3125 = 3136 13 + 243 = 256 13 + 421875 = 421888 17 + 140608 = 140625 25 + 294912 = 294937 28 + 50625 = 50653 31 + 19652 = 19683 37 + 32768 = 32805 43 + 492032 = 492075 47 + 250000 = 250047 49 + 576 = 625 49 + 16335 = 16384 49 + 531392 = 531441 64 + 190269 = 190333 73 + 15552 = 15625 81 + 1250 = 1331 81 + 123823 = 123904 81 + 134375 = 134456 95 + 279841 = 279936 121 + 12167 = 12288 121 + 255879 = 256000 125 + 2187 = 2312 125 + 50176 = 50301 128 + 59049 = 59177 128 + 109375 = 109503 128 + 483025 = 483153 169 + 58880 = 59049 243 + 1805 = 2048 243 + 21632 = 21875 289 + 6272 = 6561 338 + 390625 = 390963 343 + 59049 = 59392 423 + 16384 = 16807 507 + 32768 = 33275 625 + 2048 = 2673 864 + 923521 = 924385 1025 + 262144 = 263169 1331 + 9604 = 10935 1375 + 279841 = 281216 1625 + 16807 = 18432 2197 + 583443 = 585640 2197 + 700928 = 703125 3481 + 262144 = 265625 3584 + 14641 = 18225 5103 + 130321 = 135424 6125 + 334611 = 340736 6561 + 22000 = 28561 7153 + 524288 = 531441 7168 + 78125 = 85293 8192 + 75843 = 84035 8192 + 634933 = 643125 9583 + 524288 = 533871 10816 + 520625 = 531441 12005 + 161051 = 173056 12672 + 117649 = 130321 15625 + 701784 = 717409 18225 + 112847 = 131072 19683 + 228125 = 247808 24389 + 393216 = 417605 28561 + 89088 = 117649 28561 + 98415 = 126976 28561 + 702464 = 731025 32768 + 859375 = 892143 296875 + 371293 = 668168 36864 + 41261 = 78125 38307 + 371293 = 409600 303264 + 390625 = 693889 62192 + 823543 = 885735 71875 + 190269 = 262144 131072 + 221875 = 352947 132651 + 588245 = 720896

Увы, программа работает все равно медленно, результатов для N=10000000 я так и не дождался, время вычисления составляет больше часа (возможно я где-то ошибся с оптимизацией алгоритма, и можно сделать лучше).

Еще интереснее посмотреть результаты графически:

В принципе, вполне очевидно, что зависимость количества возможных троек от N растет заметно медленнее самого N, и вполне вероятно, что результат будет сходиться к какому-то конкретному числу для каждого ε (рискну высказать гипотезу что в данном случае оно не превысит 256:). Кстати, при увеличении ε число «троек» заметно сокращается, например при ε=0.4 имеем всего 2 равенства при N<100000 (1 + 4374 = 4375 и 343 + 59049 = 59392). Так что в целом, похоже что теорема действительно выполняется (ну и наверное ее уже проверяли на компьютерах помощнее, и возможно, все это уже давно посчитано).

Желающие могут поэкспериментировать самостоятельно, если у кого будут результаты для чисел 10000000 и выше, я с удовольствием добавлю их к статье.

Let's block ads! (Why?)

Парсер Хабра

...

суббота, 20 октября 2018 г.

Численная проверка abc-гипотезы (да, той самой)

Постановка задачи

Исходный код

Результаты

Комментариев нет:

Отправить комментарий

...

суббота, 20 октября 2018 г.

Численная проверка abc-гипотезы (да, той самой)

Постановка задачи

Исходный код

Результаты

Комментариев нет:

Отправить комментарий

суббота, 20 октября 2018 г.